gensimのDictionaryクラスでの注意事項
gensimのDictionaryインスタンスを作った段階ではid2token値が生成されていないので注意する.
- gensim.__version__ == "0.13.2" で確認
- items() を呼び出して再度値を代入すれば良いっぽい.
>>> texts = [["a", "b", "c"], ["b", "c", "c", "d"]] >>> import gensim >>> gensim.__version__ '0.13.2' >>> dictionary = gensim.corpora.Dictionary(texts) >>> dictionary.id2token # (id,token)のペアがまだない {} >>> dictionary.items() # id2tokenやtoken2idにキャッシュするため必要. [(0, u'a'), (1, u'c'), (2, u'b'), (3, u'd')] >>> dictionary.id2token # (id,token)に再度値が突っ込まれている. {0: u'a', 1: u'c', 2: u'b', 3: u'd'}