QRCode

見解探勘

opinion mining

葉鎮源
2012年10月
圖書館學與資訊科學大辭典

名詞解釋:

  見解(或稱意見)是人們對於某個實體、狀況或事件所表達出來的態度、情感、評價、感覺或情緒。見解探勘(opinion mining),普遍稱作意見探勘,又稱情感分析(sentiment analysis)或主觀分析(subjectivity analysis),乃是運用文字探勘的技術,由電腦自動從文件資料中進行情感或意見資訊的偵測、萃取及分析。其他的別名包含:情感偵測(sentiment detection)、評論探勘(review mining)、評價萃取(appraisal extraction),乃至情感計算(affective computing)皆是見解探勘的範疇。

  見解探勘主要涵括兩個部分:(1)區別文本中是否存在有意見資訊,也就是說,搜尋及萃取作者用來表達意見的文字部分,例如字詞、語句、段落,甚至於區塊或整篇文章;(2)分析前述意見文本中所隱含的語意指向(semantic orientation),包含:意見傾向(polarity)和意見強度(strength)。見解探勘的研究起源於1970年代的晚期。早期研究著重於解析文本中的信念、隱喻、敘事、觀點、影響等訊息。至今,最多學者進行探討的研究議題,當屬情感分類(sentiment classification)和主觀分類(subjectivity classification)。

  情感分類乃是評量文本的意見傾向,例如:正面、負面或中立。根據意見文本的範圍,可分為字詞、語句,以及文件等不同層級的分析。顧名思義,字詞層級即是估算字詞的意見傾向。舉例來說,「好(good)」屬於正面傾向的形容詞,而「壞(bad)」則用來表達負面的意見。語句層級通常藉由字詞意見傾向的整體表現來決定語句的意見傾向,原因是語句由字詞所組成。同理,文件層級可以透過字詞或語句層級的分析來判定。另外,意見傾向也能依照評分(rating)表示。例如:電影喜好可分為1到5顆星,其中1代表不好,3代表中立,而5代表最好。

  主觀分類則探討如何辨別具有主觀性(subjectivity)或客觀性(objectivity)意見的文本。簡單來說,即是區別文本是否存在有意見資訊。同樣地,依據意見文本範圍亦能歸類成字詞、語句,以及文件等層級的處理。主觀分類對於情感分類來說具有舉足輕重的影響,原因是主觀分類若能正確判別出含有意見資訊的文本,將有助於提高情感分類的準確性。

  見解探勘技術通常分為監督式(supsevised)意見分類與非監督式(unsupervised)意見萃取等兩大類。監督式意見分類使用機器學習來建構意見分類器的模型;常見的學習特徵條列如下:字詞與詞頻、詞類標記資訊、語句結構關係、否定詞(Negation),以及意見詞。一般認為監督式意見分類具有較高的分類準確度,但需要事先收集足夠的訓練資料供機器學習,且分類器的模型具特定領域的應用性。非監督式意見萃取則同樣使用特徵擷取組成意見傾向分類的權重方程式,唯一不同的是,權重方程式的設計取決於專家對於資料特性的觀察,非機器進行資料性質自動歸納產生。換句話說,非監督式意見萃取易於應用在各種領域當中,且不需要訓練資料。然而,其準確度相對來說比較低。

  值得一提的是,近年來隨著網際網路的發達,以及web 2.0應用的普及化,越來越多具有意見資訊的文本在網路流通分享,使得見解探勘的研究議題和相關應用也隨之越來越多元化。以下條列幾項值得進一步深入的研究議題:

  • •意見持有者與評論目標的識別(opinion holder and target identification);
  • •主題導向意見擷取(topic-oriented opinion retrieval);
  • •偽造意見的偵測(opinion spam detection);
  • •意見導向自動問答(opinion question answering);
  • •意見摘要(opinion summarization)。

參考資料:

Liu, B. (2010). Sentiment analysis and subjectivity. In N. Indurkhya & F. J. Damerau (Eds. ), Handbook of Natural Language Processing (2nd ed. ). 627-666. Boca Raton, FL: CRC Press.

Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2(1-2), 1-135.

Tang, H., Tan, S., & Cheng, X. (2009). A survey on sentiment detection of reviews. Expert Systems with Applications, 36(7), 10760-10773.

見解探勘

opinion mining

opinion mining 進行詞彙精確檢索結果
出處/學術領域 英文詞彙 中文詞彙
見解探勘 進行詞彙精確檢索結果
出處/學術領域 中文詞彙 英文詞彙

引用網址: