日韩在线精品强乱中文字幕,中文字幕无码一区二区三区一本久道,亚洲欧美精品伊人久久,国产综合网站

先進(jìn)制造業(yè)微信公眾平臺 先進(jìn)制造業(yè)全媒體

寫稿機器人“小南”上崗

2017-01-19   來源:南方都市報   評論:0
摘要: 1月17日,南方都市報社寫稿機器人小南正式上崗,并推出第一篇共300余字的春運報道。此外,南方都市報社、凱迪網(wǎng)絡(luò)和北京大學(xué)計算機科
      1月17日,南方都市報社寫稿機器人“小南”正式上崗,并推出第一篇共300余字的春運報道。此外,南方都市報社、凱迪網(wǎng)絡(luò)和北京大學(xué)計算機科學(xué)技術(shù)研究所還在小南的基礎(chǔ)上,聯(lián)合成立了“智媒體實驗室”,探索人工智能在媒體上的更多應(yīng)用。



 
  首篇文章一秒完成
 
  請用5秒的時間思考以下新聞的共同點:《蘋果第一季度營收超華爾街預(yù)測》(A pple topsStreet1Qforecasts),2015年1月發(fā)布;《8月CPI漲2%創(chuàng)12個月新高》,2015年9月發(fā)布;《綿陽安州發(fā)生4 .3級地震》,2016年5月發(fā)布;《奧運會乒乓球女子單打四分之一決賽 丁寧(中國)4:0輕松晉級下一輪》,2016年8月發(fā)布。
 
  這道題其實沒有標(biāo)準(zhǔn)答案,但不管你有沒有注意到,有一點非常重要:這些新聞的作者,都不是人。或許你已經(jīng)聽說過“寫稿機器人”———在寫作這一似乎最不可能被機器人涉足的領(lǐng)域,變化正在發(fā)生。
 
  看看這些數(shù)字:蘋果財報發(fā)布數(shù)分鐘后,美聯(lián)社的機器人報道便已完成,他們還號稱每個季度可撰寫3000篇財經(jīng)報道?!都~約時報》走得更快,其機器人編輯Blossom blot每天推送300篇文章,在財報季、運動比賽報道中寫稿已成慣例。
 
  如此速度和質(zhì)量,確實讓人類記者望塵莫及。但真正嘗試使用機器人寫稿的媒體,尤其是在國內(nèi),還并不多。如今,小南正式入場。
 
  北京大學(xué)計算機科學(xué)技術(shù)研究所萬小軍教授,是小南的技術(shù)開發(fā)團(tuán)隊負(fù)責(zé)人。他透露,小南的首篇春運報道作品,共300余字,數(shù)據(jù)自動抓取完成后,報道的生成只用了不到一秒的時間。
 
  率先進(jìn)軍民生領(lǐng)域
 
  與其他機器人“同行”有所區(qū)別的是,小南聚焦的是民生領(lǐng)域報道。
 
  此前,寫稿機器人大顯身手的領(lǐng)域,往往是體育和財經(jīng)———因為這兩個領(lǐng)域都涉及大量數(shù)據(jù)。從龐雜、枯燥的數(shù)據(jù)中尋找模式,就準(zhǔn)確度和速度而言,機器人比人類更有優(yōu)勢。
 
  人類的筆法千變?nèi)f化,但總是有“套路”,也就是模式和規(guī)則可以依循的。這時候,算法就有了用武之地。
 
  采集數(shù)據(jù)、分析數(shù)據(jù)、規(guī)劃文章結(jié)構(gòu),再到最終的遣詞用句,和人類一樣,機器人也能做到“讀書破萬卷,下筆如有神”。海量的數(shù)據(jù)和高效的算法,是寫稿機器人的兩大利器。
 
  相較于體育和財經(jīng)領(lǐng)域,民生報道的生成對機器人來說略為棘手。許多財報文章都大同小異,但民生報道的“套路”可就太多了,從交通出行到食品安全,主題也五花八門。
 
  一個民生領(lǐng)域的人類記者可以同時報道交通和食品領(lǐng)域,但就目前而言,讓機器人做到跨界的“融會貫通”還需要時間。萬小軍介紹,機器人寫稿又快又好的前提是通過大量的積累和訓(xùn)練。
 
  “教小南寫稿的過程中,主要的難點就是可供學(xué)習(xí)的樣本不夠豐富。”萬小軍說,民生議題的關(guān)注度高,卻不像常規(guī)的體育和財經(jīng)報道一樣有著相對固定的模式,訓(xùn)練語料較為缺乏。
 
  小南的未來是“智媒體”
 
  不少時政記者可能都有梳理政府工作報告的“痛苦”經(jīng)歷。動輒上萬字的文本,要在其中找到不同于去年、前年甚至是大前年的新變化、新提法,還要把這些變化簡潔又流暢地寫在報道里,第一時間發(fā)出。想象一下,記者還在一目十行地看報告找新聞點,編輯的聲聲催促已在耳邊響起:“稿子好了嗎?朋友圈里已經(jīng)有人拍了照片,轉(zhuǎn)發(fā)報告原文了,趕緊的!”
 
  生成報告摘要,是小南已經(jīng)解鎖的另一項新本領(lǐng)。近日,深圳市市委書記、市長許勤在深圳市第六屆人民代表大會第三次會議上作了政府工作報告,全文2萬多字。萬小軍把報告交給了小南,幾秒之后,2000多字的報告摘要新鮮出爐。
 
  “如果一條信息被頻繁提及,它顯然是比較重要的。”萬小軍介紹,小南采用了先進(jìn)的自動文摘技術(shù),該技術(shù)可以根據(jù)多種文本特征———如關(guān)鍵詞、段落位置等———判斷不同信息的重要性,最終在摘要里保留核心部分。
 
  小南還能做到定制化輸出。今年的政府工作,網(wǎng)友比較關(guān)心哪些部分?房價?環(huán)境?交通?只要把關(guān)鍵詞告訴小南,“他”會在稿件生成過程中注意定向分析。
 
  萬小軍說,機器人寫稿的應(yīng)用還有很多。除了寫摘要,小南將來還可以根據(jù)不同的稿件寫綜合報道,可以對已有的稿件進(jìn)行改寫,甚至試著寫有一定情感、觀點和立場的報道。
 
  事實上,小南的背后還有個大招:南方都市報社、凱迪網(wǎng)絡(luò)和北京大學(xué)計算機科學(xué)技術(shù)研究所三方昨日正式宣布聯(lián)合成立“智媒體實驗室”,小南是該實驗室的首個重要成果代表。三方將在推動媒體智能化技術(shù)研發(fā)、促進(jìn)自然語言處理等學(xué)科領(lǐng)域的發(fā)展、探索媒體智能化產(chǎn)品服務(wù)的新運營模式等方面開展深度合作,對機器寫作、文本實體識別、智能摘要、立場分析、智能服務(wù)等方面進(jìn)行研究和實踐。
和人類P K?小南還需學(xué)習(xí)
 
  那么問題來了———自從機器人報道面世以來,這個問題就沒有被停止討論———有寫得快還不容易出錯的機器人寫稿了,人類記者會不會失業(yè)?
 
  “顯然不會。”萬小軍笑道,“你看,你現(xiàn)在坐在我對面采訪,一邊采訪一邊打字,機器人肯定做不到這樣。”
 
  簡單地說,就是小南目前還不具備人類的思維。“他”只能依據(jù)既有的數(shù)據(jù)和事先設(shè)定好的程序來寫稿,不能像人類一樣思考并提出自己的問題。質(zhì)疑、追問、尋找對方話語中的新聞線索,諸如此類的人類記者的法寶,對小南來說還是太難了。
 
  此外,訓(xùn)練小南學(xué)習(xí)不同領(lǐng)域的知識和文法,也需要花時間。就像科幻動畫電影《超能陸戰(zhàn)隊》里的機器人大白,可以在護(hù)理模式和戰(zhàn)斗模式中切換,但主人得事先投入一定的時間、精力去編寫不同的程序。
 
  想想看,在電影里,小宏可是不眠不休地寫了好久代碼,輸入了空手道等各類功夫畫面,才把大白培養(yǎng)成了戰(zhàn)斗超人呢!而在此之前,他的哥哥為了調(diào)試大白的護(hù)理功能,也是做了很多的實驗,讓大白學(xué)習(xí)海量的護(hù)理知識,識別人的不同身體狀態(tài),等等。
 
  在小南的訓(xùn)練上是類似的。教“他”寫春運報道,跟寫體育報道、娛樂報道,前期需要不同的算法設(shè)計和編程工作。甚至是體育報道里的足球報道和籃球報道,也有差別。
 
  萬小軍覺得,機器人和人類各有所長,機器人擅長快速處理繁雜的數(shù)據(jù),但還做不到邏輯推理和深度歸納分析。至少在短時間內(nèi),機器人無法取代人類。不過,技術(shù)在發(fā)展,以后的機器人會不會對人類記者造成更大的沖擊,還是未知。
 
  觀點
 
  北京大學(xué)計算機科學(xué)技術(shù)研究所所長郭宗明:
 
  “人工智能和人類寫稿不沖突”
 
  機器人寫稿的優(yōu)勢,我認(rèn)為主要體現(xiàn)在三個方面。
 
  首先,機器人能夠快速地閱讀大量的文獻(xiàn)和資料。一個事件出來以后,歷史上也許有相當(dāng)多的類似事件及歷史資料,記者要去檢閱,要快速地做出報道,人類的速度是遠(yuǎn)遠(yuǎn)不如機器人的。
 
  第二,同樣的事件,機器人能做到更快,提高了新聞的時效性,同時節(jié)約了成本。
 
  第三,現(xiàn)在的新聞還講求廣泛的讀者參與。以春運為例,除了列車信息本身,春運乘客發(fā)表的微博、微信,他們的評價和關(guān)注,機器人都可以監(jiān)控到,并體現(xiàn)在報道里。
 
  機器人寫稿,或者說人工智能寫稿,跟傳統(tǒng)寫稿有很多不一樣的地方。也許機器人不那么字斟句酌,在文學(xué)價值上會打些折扣,但對于新聞報道而言,最重要的不是文學(xué)價值,而是時效性、與讀者的貼近性。在這一點上,我非??春萌斯ぶ悄軐懜?。
 
  現(xiàn)在很多人說,人工智能太可怕了,對此我并不認(rèn)同。其實人工智能和人類寫稿并不是沖突的。人類有更多的深度挖掘和分析的本領(lǐng),可以寫出很唯美的文字,可以在稿件中融入自己的親身經(jīng)歷,這些都是人工智能寫稿還做不到的。
 
  人工智能和人類應(yīng)該是共存關(guān)系。更進(jìn)一步說,人工智能是跟人類共同進(jìn)化。
 
  問答
 
  Q:小南,你是男孩子還是女孩子?
 
  A:我是機器人啊。你問問我爸爸。
 
  Q:你寫一篇稿子要多久?
 
  A:這要看電腦夠不夠好……哈哈,開玩笑,通常來說,數(shù)據(jù)抓取完成后,我生成報道最快只要零點幾秒哦!
 
  Q:你剛寫的春運報道還比較短,長稿子能寫嗎?
 
  A:可以啊,我能寫800字的消息,也可以寫3000字的報告呢!這要看你給我什么設(shè)定。
 
  Q:你覺得寫稿難嗎?最難的是什么?
 
  A:最難的其實是學(xué)習(xí)。我的學(xué)習(xí)本領(lǐng)很強,但是可供我學(xué)習(xí)和模仿的報道樣本還有點少。
 
  Q:小南,你覺得你的優(yōu)勢在哪里?
 
  A:我24小時連軸轉(zhuǎn)也不累,不用放假,分析數(shù)據(jù)也不容易眼花出錯。
 
  Q:小南啊,你寫的稿子有點干巴巴的,讓編輯姐姐改兩句唄?
 
  A:這可不行!我爸爸說了,機器人寫稿一定要原創(chuàng),不能后期人工添加,這是原則。你放心,等我學(xué)習(xí)時間長了,學(xué)的東西多了,會越寫越好的~
 
  Q:有了你,我們?nèi)祟愑浾邥粫聧彛?/span>
 
  A:哈哈,我覺得不會。雖然我搜集數(shù)據(jù)和生成文本的速度比你們快,但是我不會提問,也暫時寫不出有深度分析、有感情表達(dá)的報道。讓我們共同進(jìn)步吧。
 
  揭秘
 
  每個成功的機器人背后都有一群“老師”
 
  開篇之作如何寫就?
 
  技術(shù)團(tuán)隊和南都的編輯團(tuán)隊商討后,決定以春運作為小南的試水之作。
 
  南方都市報首席編輯鄒瑩,是“調(diào)教”小南的負(fù)責(zé)人之一。她說,選擇春運,是因為這一題材很好地契合了民生新聞的特色與小南寫稿的優(yōu)勢:春運涉及面廣,民眾關(guān)注度高,又有大量的數(shù)據(jù)可供小南抓取分析。
 
  接下來,由編輯團(tuán)隊提供范文樣本,確定熱門城市、車次、車型、余票等報道點,再通過技術(shù)團(tuán)隊設(shè)計算法,對小南的文字組織功力進(jìn)行訓(xùn)練。
 
  春運中,到哪些城市的票賣得最快?廣州和北京?好的,小南,以后重點監(jiān)控這兩個城市。
 
  廣州到南京的票不足10張了,人類記者會寫什么?多半是趕快下手、抓緊買票、余票緊張。小南你記住,下次監(jiān)控到小于10張的車票數(shù)據(jù),就這樣寫。
 
  說白了,名為“機器人”的小南,真身其實是一套程序系統(tǒng)?;跈C器學(xué)習(xí)算法,通過融合領(lǐng)域知識,小南能夠?qū)?shù)據(jù)進(jìn)行深度分析,發(fā)掘重要的消息和事件,并用自然語言進(jìn)行表達(dá)。同時,小南也能對已有的文本素材進(jìn)行語句篩選與融合,從而以秒速生成報道。
 
  在編輯團(tuán)隊的指引下,小南還會持續(xù)地學(xué)習(xí)模仿人類的寫作方式。例如,在判斷出剩余票數(shù)或是列車行駛時間后,小南能使用不同的詞語來形容,如“票數(shù)緊張”及“旅途較累”,讓報道看起來不那么冷冰冰。
 
  訓(xùn)練小南的過程中,有個細(xì)節(jié)讓鄒瑩印象深刻。“小南寫出的稿件,編輯出于本職,想著是否要核對一下數(shù)據(jù)。北大的技術(shù)團(tuán)隊說,不需要,機器人不會弄錯數(shù)據(jù)。”鄒瑩說。
 
  小南上崗試用期間,有編輯感嘆:寫得真不錯,而且勤奮!
 
   相關(guān)熱詞搜索:先進(jìn)制造 機器人
先進(jìn)制造業(yè)簡介| 版權(quán)聲明| 招聘信息| 網(wǎng)站地圖| 友情鏈接| 聯(lián)系方式|