優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

小議識別網(wǎng)絡(luò)新聞“標(biāo)題黨”

作者:張曉春來源:《文學(xué)教育》日期:2018-05-29人氣:1817

我們通常認為,在網(wǎng)絡(luò)上,一篇新聞報道要想獲得較高的點擊量,必須有吸引人的標(biāo)題、優(yōu)質(zhì)的內(nèi)容、廣泛的推廣渠道,相比于內(nèi)容和渠道,對標(biāo)題的再加工無疑是成本最小、收效最大的。隨著網(wǎng)絡(luò)信息的膨脹與快速變化,僅僅為吸引人眼球的標(biāo)題黨談不上任何創(chuàng)新創(chuàng)意,也絕無過人之處,有的只是罔顧事實,誤導(dǎo)輿論。網(wǎng)絡(luò)新聞標(biāo)題黨雖然能夠博人眼球,但是卻失去了新聞報道最重要的功用——保障知情、輿論監(jiān)督、促進公正,對于新聞輿論的公信力也是極大損傷。

本文首先介紹了網(wǎng)絡(luò)新聞標(biāo)題黨出現(xiàn)的原因及其危害,通過對幾個典型的標(biāo)題黨新聞的分析來探究標(biāo)題黨新聞識別技術(shù)的主要目的,介紹當(dāng)前國內(nèi)主要標(biāo)題黨新聞識別技術(shù),厘清標(biāo)題黨新聞識別的主要方法,指出這些方法存在的問題和局限性。最后,針對如何更好地進行標(biāo)題黨新聞識別提出了一些自己的見解,希望標(biāo)題黨識別技術(shù)能夠在將來變得更加完善、高效,在一定程度上阻止標(biāo)題黨新聞的傳播,提高受眾者的閱讀品質(zhì)。

 

一、何為“標(biāo)題黨”

眾所周知,標(biāo)題是新聞的眼睛,在當(dāng)前信息化快速發(fā)展的時代中,人們接受新聞的方式呈現(xiàn)出多樣性,出現(xiàn)5秒效應(yīng)或者看新聞看題的提法,這種情況下在一定程度上體現(xiàn)出了新聞標(biāo)題的作用。此外,在網(wǎng)絡(luò)新聞中標(biāo)題同樣需要加以關(guān)注,只有如此才能讓快速抓住受眾,完成引導(dǎo)活動,形成良好閱讀,換而言之,現(xiàn)階段網(wǎng)絡(luò)新聞的競爭主要體現(xiàn)在網(wǎng)絡(luò)新聞標(biāo)題的競爭之上。

《現(xiàn)代漢語詞典》(第六版)中并沒有收錄“標(biāo)題黨”這一詞條。一般認為,“標(biāo)題黨”是發(fā)端于網(wǎng)絡(luò)論壇,發(fā)帖者為吸引人氣,提高帖子的點擊量而制作博人眼球標(biāo)題的網(wǎng)絡(luò)貼主群體或行為?!皹?biāo)題黨”可以說是這樣一些信息發(fā)布和轉(zhuǎn)發(fā)行為、人群的總稱。 “標(biāo)題黨”的目的不是為傳播信息本身,而是為了引起關(guān)注,獲取更多的經(jīng)濟利益。網(wǎng)編們?yōu)榱嗽诤A康男畔⒅挟愜娡黄?獲取點擊率,爭取到好的排位,有更多的廣告收益,紛紛仿效廣告業(yè)“標(biāo)題黨”的手法將大量新聞標(biāo)題重新包裝,挖空心思“嘩眾取寵”,大量“題不對文”的新聞標(biāo)題就此出籠。從特點上分析,標(biāo)題黨具有兩個特征,第一是夸大性:主要是對文章內(nèi)容進行夸大,以此起到吸引受眾眼球的作用;第二是作假型:標(biāo)題與文章的內(nèi)容有所差別,內(nèi)容描述的是另外一個事實,但是為了提高受眾的注意力,則將標(biāo)題設(shè)定為其它內(nèi)容,起到吸引的作用。無論哪一個特點,均在一定程度上反映出了標(biāo)題黨這種現(xiàn)象沒有遵循新聞的實際情況,也沒有符合新聞發(fā)展的要求,長此久往則會導(dǎo)致新聞呈現(xiàn)出缺陷與不足,甚至在新時期讓人們對新聞形成不良情緒。

 

二、標(biāo)題黨新聞識別的必要性

   

原標(biāo)題:“大胸”比“平胸”更易患乳癌

  記者獲悉,中國女性超過一半是致密性乳腺,患乳腺癌的風(fēng)險比脂肪性乳腺高4.7倍,而且,密集的腺體易掩蓋早期癌癥病癥。這是因為,亞洲女性的乳房相對較小,且以致密性乳房為主。以致密性乳腺為主的亞洲女性,如果只用手動超聲做為第一線做乳腺癌篩查,可能會存在一定的漏診。

析因:超過50%的中國女性是致密性乳腺

在中國,超過50%的女性具有致密性乳腺。擁有致密性乳腺的女性,相對于脂肪性乳腺的女性,罹患乳腺癌的風(fēng)險高4.7倍。(節(jié)選)

這種新聞就是典型的“標(biāo)題黨”!全篇新聞沒有一次出現(xiàn)“大胸”、“平胸”,但在標(biāo)題中卻出現(xiàn)了“‘大胸’比‘平胸’更容易患乳腺癌”的結(jié)論,簡直是驚為天人。本來一個“中規(guī)中矩”的標(biāo)題,在他們手下,就變了大樣。 “標(biāo)題黨”抓住人們“掃視”新聞的這一心理,誤導(dǎo)大眾,不明事實真相的“吃瓜群眾”將這種不經(jīng)過大腦分析的消息通過網(wǎng)絡(luò)傳播給他人,以訛傳訛,謠言就產(chǎn)生了。從另外一個角度分析,如果這種文章傳輸給受眾,則會讓受眾無法辨別其真實性,甚至還會產(chǎn)生抵觸心理,嚴(yán)重影響了新聞的真實性以及全面性。除此之外,在當(dāng)前的發(fā)展背景下,需要清楚的認識到標(biāo)題黨所帶來的影響,并且能夠從本質(zhì)出發(fā),從新聞識別的方式出發(fā),對標(biāo)題黨新聞的識別方法進行對比與分析,這樣才能真正提高新聞的可行性以及創(chuàng)新性。

 

三、標(biāo)題黨新聞識別方法介紹及對比

1、基于主題句分布的標(biāo)題黨新聞識別算法

在新聞標(biāo)題與主題內(nèi)容相關(guān)程度研究方面,國內(nèi)有學(xué)者對“標(biāo)題黨”類新聞的識別進行了研究,王志超提出中提出了一種基于內(nèi)容主題句相似度的“標(biāo)題黨”新聞識別方法: 首先從正文中提取出可能反映正文主題的句子集合,再分別計算它們與標(biāo)題的相似度,并以最大相似度作為評價參數(shù)。這種方法歸根到底是網(wǎng)頁信息抽取→主題句提取→句子相似度計算。但這個方法對于“以偏概全”的新聞難以達到較好的識別作用。它對一些同義詞以及未登錄詞、專有名詞無法很好地識別。比如林俊杰演唱會的報道中同時出現(xiàn)“林俊杰”和“JJ”,他們是一個人,但是基于主題句的識別方法認為兩個詞不相關(guān),句子相似度計算出現(xiàn)誤差。這種方法終究沒有避免 TF-IDF只考慮上下文統(tǒng)計特性而不考慮語義信息的局限。漢語句子的表達形式是多種多樣的,如果要準(zhǔn)確地刻畫一個句子所表達的意思,還應(yīng)該結(jié)合語法結(jié)構(gòu)信息。所以在進行新聞報道的時候,需要多角度的分析與研究,并且要從本質(zhì)商除法,對主題句分布的標(biāo)題黨新聞識別加以重視,如此才能實現(xiàn)新聞報道的有效與全面。

2、基于主題詞分布的識別算法

考慮到主題句識別算法的短板,又有學(xué)者引入了基于主題詞分布的新聞識別算法。首先從新聞標(biāo)題中提取出最能反映標(biāo)題中心含義的主題詞。再分析主題詞在新聞?wù)闹械姆植记闆r,最后根據(jù)分布情況計算出是正常新聞的概率,從而判斷是否為標(biāo)題黨新聞。這個算法考慮到短語結(jié)構(gòu)分析和依存句法分析,分析句子結(jié)構(gòu)對主題詞集合K的形成提供了幫助。但是這個方法也存在一些問題,根據(jù)依存句法所構(gòu)建的24種關(guān)系詞典都可以進行二次處理嗎?在對多名詞短語處理時如何確定這個名詞短語是否過濾?

北京飯館老板換大招牌迎接奧運

“北京飯館老板”為并列名詞,處理后變?yōu)?“老板換大招牌迎接奧運

萬一作者強調(diào)的重點就是這個“北京老板”喜迎奧運呢?這種情況該如何識別?

3、基于潛在語義的標(biāo)題黨新聞識別算法

這種標(biāo)題黨識別技術(shù)以潛在語義分析算法為理論基礎(chǔ)、以矩陣的奇異值分解為核心。這種方法的優(yōu)點有以下幾點:1.可消除無關(guān)詞語的干擾。 2.抽取正文簡單有效。3.從與新聞標(biāo)題相關(guān)的段落數(shù)占總段數(shù)的比值,以及這些段落內(nèi)容總長度占新聞?wù)目傞L度的比值兩個角度對目標(biāo)新聞內(nèi)容進行雙重判定。這種方法有是有明顯的局限性的,(1)網(wǎng)頁新聞布局結(jié)構(gòu)造成識別誤差(2)分詞詞典具有局限性,人名、地名、網(wǎng)絡(luò)詞匯等未登錄詞無法正確識別。

 

從總體上看,這三種方法都有各自明顯的優(yōu)勢和缺點,如果能將主題詞識別新聞技術(shù)和潛在語義識別新聞技術(shù)結(jié)合起來使用,應(yīng)該是很有幫助的。在提取新聞?wù)暮瓦M行分詞的過程中我認為還有一些問題需要注意:

1、 現(xiàn)在的網(wǎng)頁不只包含新聞?wù)?,網(wǎng)頁兩邊還會有廣告,正文下方還會有“相關(guān)推薦”。這部分信息肯定會干擾關(guān)鍵詞的識別,那該如何篩除這部分信息?

2、 在對標(biāo)題、正文進行切詞時,應(yīng)該采用多種分詞算法相結(jié)合的方法。如切分“北京大學(xué)生運動會今日開幕”這樣的句子,可以使用正、逆向最大匹配方法,得到粒度更細的分詞結(jié)果。但是雙向最大匹配無法發(fā)現(xiàn)鏈長為偶數(shù)的交集型歧義,那么可以增加回溯機制。

3、 分詞詞典是進行標(biāo)標(biāo)題識別不可缺少的部分,未登錄詞、新詞語、方言詞難以識別是造成識別率較低的原因之一。建立動態(tài)分詞詞典和語料庫就是我們必須要提上日程的事。同時,現(xiàn)在的新聞標(biāo)題,尤其是網(wǎng)絡(luò)新聞標(biāo)題中大量使用字母詞,對字母詞的識別也是我們需要注意的。

4、 在《基于潛在語義分析的標(biāo)題黨新聞識別技術(shù)研究》中,作者使用了基于詞頻統(tǒng)計的方式。但是,僅僅考慮新聞的分詞單位和段落之間的關(guān)系是不夠的,還需要了解分詞單位與其上下文之間的關(guān)系。這時可以利用TF·IDF算法來計算各單位對于各個段落的重要程度。 所以無論從哪一個角度分析,均可以清楚的認識到在網(wǎng)絡(luò)新聞標(biāo)題是十分關(guān)鍵的,需要多加關(guān)注與研究,加強分析與研究,避免出現(xiàn)標(biāo)題黨現(xiàn)象的發(fā)生。

四、結(jié)語

總而言之,在當(dāng)前時代的不斷發(fā)展下,網(wǎng)絡(luò)新聞標(biāo)題語中存在很多不規(guī)范的地方。這些不規(guī)范的現(xiàn)象產(chǎn)生了許多消極的影響,嚴(yán)重破壞了語言的純潔性,尤其是標(biāo)題黨的出現(xiàn),沒有遵循新聞的基本要求,也沒有從本質(zhì)出發(fā),實現(xiàn)新聞傳播的有效性,故此本文通過對網(wǎng)絡(luò)新聞標(biāo)題黨識別算法進行簡單分析和比較,對網(wǎng)絡(luò)新聞標(biāo)題的識別情況有一個整體性的了解和認識,發(fā)現(xiàn)了新聞標(biāo)題黨識別技術(shù)在使用上存在的一些問題,并提出相關(guān)的意見和建議。雖然現(xiàn)在已經(jīng)出現(xiàn)多種識別網(wǎng)絡(luò)新聞標(biāo)題黨識別的技術(shù),但是它們都存在或多或少的問題,對于這方面的研究還需要繼續(xù)深入,我們能做的還有很多。


本文來源:《文學(xué)教育》:http://xwlcp.cn/w/wy/63.html

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言