软件开发客服
首页 > 上上资讯 > 软件定制自动维护维基百科内容系统进行中

软件定制自动维护维基百科内容系统进行中

2020-02-15 16:45:47编辑:上上定制浏览量:243

MIT研究人员创建能够自动维护维基百科的系统,修正文章中错误的资料,减少需要花费的人工编辑时间。维基百科具有数百万篇文章,文章需要不断更新以呈现最新的资讯,包括进行文章扩展、重写或是资料修改等,而这些工作需要由全世界的志工手动完成。这个新的自动系统,能够以人工智慧修复维基百科文章中的错误,其使用一系列的演算法,透过利用网路上最新的资讯,辨识出文章中的错误,并且生成句子修复错误。该系统背后裡用了许多文字生成技术,可用来辨识两个句子间矛盾的地方,并将他们融合在一起。

软件定制自动维护维基百科内容系统进行中

目前也存在许多自动编辑维基百科的机器人,但这些工具通常用于减轻破坏,或是将严格定义的资讯放进预定义的模板中,研究人员希望新开发的系统,只要给定一段非结构化的句子,就能以人性化的方式,修改维基百科文章中的句子,研究人员提到,现存的机器人多数是以规则执行任务,但是他们的系统可以推论两个句子矛盾之处,并且产生连贯的文字。用来训练自动系统模型的资料集,便是包含正确资讯的语句以及维基百科语句所构成的句对,而这些句对会被标上同意、不同意或中性三种标籤,同意代表正确资讯的语句和维基百科的语句资讯相符,不同意则反之,中性则代表没有足够的判断资讯。


自动化系统的输入有两个,一个是维基百科文章中过时的句子,另一个为包含正确资讯的语句,系统需要根据后者,自动调整维基百科中错误的句子,过程可能需要删除和保留特定单词、更新部分的事实,或是保留样式和语法。自动化系统由两个模型组成,其一是事实检查分类器,透过预训练将句对标记为同意、不同意或中性,而系统处理的重点在于不同意标籤的句对,而另一个分类器,则负责辨识维基百科错误的语句中,导致句对被标记为不同意的单词,并且以双编码器与解码器框架,将包含正确资讯语句的重点单词,融入到维基百科需要修改的语句,输出最终的句子。

标签: 维基百科

11

相关资讯

谷歌致力于实现全部Android程序的TLS化

谷歌致力于实现全部Android程序的TLS化

谷歌Play上的Androidapp,早已有超过80%的比例都通过(TransportLayerSecurity,TLS)协约来数据加密流量传输。对于极少数并未採用TLS的app,

标签: TLS

软件信息科技改变零售业的边界

软件信息科技改变零售业的边界

随着科技的高速发展,软件科技日益改变人们的生活习惯,尤其是购物环节,传统的零售业面临巨大的冲击。某宝、某多多,某东等等作为现代购物软件的标杆,逐渐成为当代零售界软件时代的宠儿。一、

标签: 软件科技 零售业边界

Python 2.7正式终止更新升级支持

Python 2.7正式终止更新升级支持

Python软件基金会(PythonSoftwareFoundation)已经于今年元旦宣布停止对Python2.7程序語言的支持,意味著以后将不会再对于Python2.7开展安全

标签: Python 2.7 Python 2.0 Python 3.0