国产精品久久久久aaaa_午夜精品成人一区二区视频_在线观看日韩_欧美日韩精品一区二区三区蜜桃_女人被狂躁后的视频免费_日本成人在线播放

首頁 新聞 > 洞察 > 正文

謠言or真相?三個步驟告訴你 準(zhǔn)確率超八成

謠言or真相?三個步驟告訴你 準(zhǔn)確率超八成

阿里巴巴達(dá)摩院科學(xué)家造了一個識別謠言的神器

AI謠言粉碎機,謠言識別準(zhǔn)確率達(dá)81%

昨天,一篇《為拯救爸媽朋友圈,達(dá)摩院造了“謠言粉碎機”》的文章,在朋友圈刷屏,引來一片鼓掌叫好:“這下終于不用費勁勸導(dǎo)爸媽了!”

文章說的是,阿里巴巴達(dá)摩院的科學(xué)家,造了一個謠言粉碎機,這是一個算法模型,可以識別真假新聞,未來也能應(yīng)用在各大領(lǐng)域。

這是怎樣一種算法?準(zhǔn)確率高嗎?真的可以終結(jié)謠言?記者聯(lián)系到了正在大洋彼岸的“謠言粉碎機”的創(chuàng)造者李泉志。

“粉碎機”的前生功能

是為記者提供可靠線索

《速轉(zhuǎn)!科學(xué)家發(fā)現(xiàn):一味中藥48小時可殺死60%癌細(xì)胞!》《晚上喝白開水的朋友,再不看就晚了!》《專家說了,這樣?xùn)|西千萬別吃!》……

你有沒有收到過父母發(fā)來的這些“關(guān)懷”?又有多少次是抱著“算了算了,你開心就好”的心態(tài)結(jié)束話題?

“不能保證百分之百準(zhǔn)確,但基本可以判斷是否為謠言。”李泉志,達(dá)摩院NLP團隊的核心成員之一,畢業(yè)于清華大學(xué),后在美國獲得自然語言理解方向的博士學(xué)位,目前在達(dá)摩院的西雅圖辦公室工作。

在加入達(dá)摩院前,他曾是路透社重要的“情報官”:通過機器篩選成千上萬的網(wǎng)絡(luò)信息,為數(shù)千位一線記者提供可靠線索。

“AI謠言粉碎機”就是借助自然語言實現(xiàn)的。在剛剛結(jié)束的SemEval(自然語言處理領(lǐng)域的國際權(quán)威比賽,由國際計算語言學(xué)學(xué)會舉辦)全球語義測試中,“AI謠言粉碎機”創(chuàng)造了假新聞識別準(zhǔn)確率的新紀(jì)錄,達(dá)到了前所未有的81%。

判斷一個新聞?wù)婕?/strong>

要分三個步驟

“AI謠言粉碎機”要怎么去判斷是否為謠言呢?李泉志說,分三步——

首先,該模型會找到最初的信息源,分析用戶畫像,包括:專業(yè)領(lǐng)域,此前傳播或轉(zhuǎn)發(fā)過什么,是個人還是機構(gòu),注冊時間,活躍規(guī)律等,來判斷發(fā)布者是否“可靠”。最后根據(jù)不同態(tài)度的人群比例、各自的信譽度等信息,計算出此新聞的可信度。

第二步,尋找網(wǎng)上所有的信息源,看看鏈接的域名,是否來自可信網(wǎng)站,比如新華社、政府醫(yī)藥管理局等。

第三步,將正文里關(guān)鍵的論證提煉為知識點,與知識圖譜里的權(quán)威知識庫做匹配驗證。如果毫無聯(lián)系、自相矛盾,減分。

李泉志解釋,“AI謠言粉碎機”會考慮一部分人類的想法,更多的則是 AI的運用。人工智能有很多人類比不了的地方,比如當(dāng)一個流言在社交網(wǎng)站上傳播很快的時候,我們很難去判斷真假,不知道誰接收到了,是出于什么原因轉(zhuǎn)發(fā),不同的人對此的評價是什么,而這些AI可以做到。“假如來一個流言,人可以通過網(wǎng)站去查證,但是AI可以快速把科學(xué)研究、新聞拉出來,加上后臺知識庫的對比,做一個驗證。人腦中有基本判斷,但是沒有大型的知識庫。”李泉志說。

就拿“AI謠言粉碎機”的訓(xùn)練樣本來說,就要分至少兩個層面:首先拿底層的2億條信息,幾百萬條新聞,訓(xùn)練語言樣本;再將模型進行謠言的真實性訓(xùn)練。“是一個復(fù)雜且費時的過程。”李泉志表示。

誰制造謠言,論文是否抄襲

未來粉碎機還有更多功能

其實,要建這樣一個數(shù)據(jù)模型,并不容易。李泉志坦言,他在前一家公司就開始研究,到如今,也還需繼續(xù)完善。他們有一個小團隊專門在研究這一技術(shù),因為,總體來說這不是一個單獨能列出來的技術(shù),是自然語言所有技術(shù)的綜合。

目前,該模型也并未應(yīng)用于阿里巴巴的任何業(yè)務(wù)中,李泉志坦言,數(shù)據(jù)模型需要不斷被“訓(xùn)練”,也需要得到社會的認(rèn)同,而這些,都不是短時間內(nèi)能解決的。

可以想象的是,“AI謠言粉碎機”未來將被應(yīng)用的多個場合。

比如,可以識別論文是否為抄襲,用技術(shù)從個人的寫作風(fēng)格、方法論、主題等多維度去判斷是否為抄襲。過去有人說某年輕作家后期的作品由人代筆,以后用AI就能分析得出結(jié)論。

另一方面,可以協(xié)助警方找到真正謠言的制造者。通過AI去追蹤傳播路徑,從傳播路徑中,將傳播分解,可以發(fā)現(xiàn)規(guī)律,比如傳播了哪些用戶,用戶是什么反應(yīng),是簡單的轉(zhuǎn)發(fā),還是贊成、反對,還是進行了二次加工?

“當(dāng)然,該模型也還是需要更多的語言訓(xùn)練。比如有些用戶轉(zhuǎn)發(fā)時,說的是反話、諷刺,有些是隱喻,不知是否是真實的情緒表達(dá),這些作為機器很難對此做出判斷,但是通過大量的訓(xùn)練,是可以實現(xiàn)的。”李泉志表示,他和團隊會繼續(xù)研究該模型。(朱銀玲)

關(guān)鍵詞: 謠言 真相 準(zhǔn)確率 計算

最近更新

關(guān)于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.pdssy.com.cn All rights reserved
聯(lián)系我們:33 92 [email protected]
豫ICP備2020035879號-12

 

主站蜘蛛池模板: 一区二区中文字幕 | h5.meihuan.art| 国产毛片视频 | 日韩欧美一区二区三区免费观看 | 日本 欧美 国产 | 久久国产资源 | 99re在线精品| 日韩在线高清 | 国产日韩精品一区 | 午夜日韩| 欧美电影一区 | 国产在视频一区二区三区吞精 | 99色吧 | 中文字幕一区二区三区乱码图片 | 波多野结衣中文一区 | 一区二区三区高清视频在线观看 | 久爱www成人网免费视频 | 奇米影视图片 | 中文字幕亚洲一区 | 新神奇四侠免费完整版在线观看 | 91婷婷射 | 一区在线视频 | 国产成人一区二区三区 | 亚洲免费在线视频 | 日日摸狠狠的摸夜夜摸 | 精品成人A片久久久久久船舶 | 免费一区二区三区 | 国产不卡视频在线播放 | 国产一区二区久久 | 日韩在线1| 一级片在线播放 | 色婷婷色 | 国产性夜夜性夜夜爽91 | 午夜激情视频在线 | 国产短视频精品区第一页 | 精品无人乱码一区二区三区 | 欧美日韩精品在线观看 | 天堂精品 | 亚洲国产精品成人 | 亚洲欧美一区二区三区国产精品 | 三级a做爰大乳在线观看 |