智能对话模型<br><br>概述<br><br>AIML 人工智能标记语言<br><br>WebQA 开放域问答<br><br>Deeplearning 深度学习<br><br>效果展示<br><br><br><br>启动服务<br><br>环境说明<br><br>Linux/Python2.7/PyCharm<br><br>安装依赖<br><br>$ pip2 install jieba $ pip2 install aiml $ pip2 install lxml $ pip2 install beautifulsoup4 $ pip2 install flask<br><br>运行流程<br><br>Working directory: chatbot-aiml-webqa/core<br><br>$ cd chatbot-aiml-webqa/core $ python2 web/server.py (or $ nohub python2 web/server.py) > ...... > * Running on http://0.0.0.0:5000/ (Press CTRL+C to quit) CURL: $ curl "0.0.0.0:5000/chat" -d "message=新闻" $ curl "0.0.0.0:5000/chat" -d "message=天气" $ curl "0.0.0.0:5000/chat" -d "message=时间"<br><br>处理流程<br><br>步骤一:预处理<br><br>限制字数<br><br>过滤敏感词(恶心、政治、色情、违法......)<br><br>步骤二:知识库匹配(AIML)<br><br>基本功能:打招呼、闲聊......<br><br>异常处理:问题太长、空白问题、找不到回复......<br><br>情绪回答:表情、夸奖、嘲笑......<br><br>如果匹配不到回答,进行步骤三<br><br>步骤三:互联网搜索(WebQA)<br><br>新闻----新浪新闻<br><br>文章----每日一文<br><br>笑话----糗事百科<br><br>时间----搜狗时间<br><br>天气----搜狗天气<br><br>空气----搜狗空气<br><br>其他遍历百度搜索<br><br>百度汉语<br><br>百度翻译<br><br>百度图谱<br><br>百度汇率<br><br>百度计算<br><br>百度股票<br><br>百度歌词<br><br>百度最新<br><br>百度百科<br><br>百度知道<br><br>如果搜索不到回答,进行步骤四<br><br>步骤四:神经网络<br><br>基于Seq2Seq模型的下一代对话引擎不仅仅是在现有的回答中训练最佳回答,而是能自我创造一个类似于人类的回答。<br><br>语料库:http://61.93.89.94/Noah_NRM_Data/<br><br>目前这部分没时间实现......暂时先用图灵机器人API代替吧~~~<br><br>学习功能<br><br>利用AIML模板+shelve存储<br><br>* 说错 *<br><br>* 答错 *<br><br>......<br><br>ME > 世界上最漂亮的人是谁 AI > 灰姑娘 ME > 你说错了 AI > 那你教我吧 ME > 白雪公主 AI > 我学会啦,下次你就可以问我"世界上最漂亮的人是谁"...... ME > 世界上最漂亮的人是谁 AI > 白雪公主