Skip to content

hengchao0248/ccf2016_sougou

Repository files navigation

大连理工大学信息检索实验室

重现实验

把原始数据 user_tag_query.10W.TRAIN 和 user_tag_query.10W.TEST 放在./data/目录下,然后运行run.sh 最后能生成 tfidf_dm_dbow_20W.csv,该结果B榜成绩会在0.724左右。 建议在ubuntu环境下运行,windows环境下,也可以运行run_cv.ipynb

数据下载

https://pan.baidu.com/s/1bpGIfxX 提取码:kcnm

依赖

  • Anaconda 4.2.0(Python 3.5 version)
  • jieba 0.38
  • keras 1.1.0
  • xgboost 0.6
  • gensim 0.13.2

平台

ubuntu 16.04

硬件

本代码是在8core,i7CPU,8gb RAM 的电脑上开发的.总共运行时间大概需要5个小时

About

ccf2016 sougou final winner solution

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published