Skip to content

Latest commit

 

History

History
8 lines (7 loc) · 245 Bytes

README.md

File metadata and controls

8 lines (7 loc) · 245 Bytes

这是微博数据的处理项目

  • config.yaml:配置文件
  • data_filter.py:去除非中文字符
  • data_segment.py:切分词
  • main.py:主流程
  • train_word2vec.py:训练word2vec模型
  • load_word2vec.py:加载word2vec模型