QRCode

專有名詞標記 / 命名實體標註

named entity tagging

曾元顯
2012年10月
圖書館學與資訊科學大辭典

名詞解釋:

專有名詞標記(name entity tagging),或稱命名實體標註,是自然語言處理中的一項任務,也跟資訊檢索中的資訊擷取議題有關。在全文文件中,常有人名、地名、機構名等詞彙出現,以及關於時間、金錢等不同格式數據的表達,這些詞彙經常不會出現在既有的詞庫中,因此需要特別的標註,以便擷取及應用。

以此句為例:「昨日報載誤指陳光標捐了伍佰元給西湖的人民黨」,專有名詞標記需將:「昨日」標註成時間名詞並轉換成日期,「陳光標」標註為人名,「伍佰元」標註為金錢數量,「西湖」標註為地名,「人民黨」標註為組織名。若標註技術不佳,可能會將該句斷出「日報」、「指陳」、「伍佰」等詞彙,以致於影響專有名詞的辨識與標記。

專有名詞的標記,不僅可以解決詞庫涵蓋不足的問題,也因其牽涉到人、事、時、地、物等重要內容,對於文字的自動理解、推論、重點摘要,以及資訊的檢索、知識的探勘,都是重要的參考依據。

國際上最早進行專有名詞標記的評比活動,是美國於1987年開始的訊息理解會議(Message Understanding Conference,簡稱MUC)。參與評比的隊伍,對英文的專有名詞標記,其最佳成效已接近人工標註的水準。對中文的標註,其成效雖然還有相當的落差,但已可協助大量語料的自動化處理,進行相關的應用。

專有名詞標記 / 命名實體標註

named entity tagging

named entity tagging 進行詞彙精確檢索結果
出處/學術領域 英文詞彙 中文詞彙
專有名詞標記 / 命名實體標註 進行詞彙精確檢索結果
出處/學術領域 中文詞彙 英文詞彙

引用網址: