Welcome! 登入 註冊
美寶首頁 美寶百科 美寶論壇 美寶落格 美寶地圖

Advanced

[人工智慧] 情感分析 電腦新領域 / 國際先驅論壇報

[人工智慧] 情感分析 電腦新領域 / 國際先驅論壇報

分類標籤: 網路公司  網路  科技
工商時報 2009.10.5
原文刊於國際先驅論壇報,顏嘉南摘譯

電腦或許善於處理數字,但它能處理情感嗎?


隨著部落格和社交網站的崛起,網路成為個人意見的集散地,這裏充斥著許多評論、排名、建議,以及其他形式的線上意見。對電腦科學家而言,這種成長快速的網路資料,為網路使用者的集體意識開了一扇窗。


名為「情感分析」的新興領域,在電腦世界尚屬於未完全開拓的領域之一,現已逐漸成形,將人類異想天開的情感,轉譯為具體數據。


對許多企業而言,線上觀點已變成一種虛擬貨幣。


這不僅是一個有趣的程式練習,對許多企業而言,線上觀點已變成一種虛擬貨幣,能成就一項產品,或是讓其走出市場。


然而許多公司仍難以理解這些網路世界上的抱怨,這些怨言目前仍圍繞著他們的產品。隨著情感分析工具開始成形,不僅能幫助企業改善業務盈虧,最終也能改變線上資訊的搜尋經驗。


數家新的情感分析公司,打算進入該市場。美國舊金山Scout Labs公司的產品副總裁法蘭西斯(Margaret Francis)表示,「社交媒體過去不被重視,但現在被視為提供市場情報不可或缺的命脈。」


Scout Labs係由Cnet創辦人米諾(Halsey Minor)成立的創投公司所資助,Scout Labs近期推出一項訂閱服務,讓客戶監督部落格、新聞、線上論壇和社交網站,以了解關於產品、服務或是新聞主題的趨勢等。


5月初,全美最大門票網路交易平台StubHub採用Scout Labs的監測工具,以了解洋基對紅襪的比賽因下雨而延遲,迅速在部落格形成的負面情緒。


由於球場誤將比賽取消的消息,告知數百位球迷,且StubHub拒絕球迷退票的要求,因為該場比賽實際並沒有取消,但在發現不滿情緒在網路上流傳後,球場答應提供受影響的球迷折扣,現在球場正重新評估其壞天氣政策。StubHub客服主任惠蘭(John Whelan)表示,「這件事對公司而言,好比是警報器。」


協助企業準確掌握客戶對特定議題的觀點,並做出回應。


Jodange公司針對線上出版者提供服務,讓他們可以接收來自45萬個來源的意見數據,包括主流新聞媒體、部落格和Twitter。


依據康乃爾大學前電腦教授卡蒂(Claire Cardie)和匹茲堡大學電腦教授魏比(Jan Wiebe)的研究,該項服務運用複雜的演算法,不僅對特定主題進行情感評估,也找出最有影響力的意見發表者。


Jodange的投資者包括美國國家科學基金會(NSF),該公司目前正在研發一套新的演算法,可利用意見數據預測未來發展,例如預測報紙社論對某家公司股票的影響。無獨有偶,英國金融時報甫於近期推出了實驗程式Newssift,可追蹤新聞中關於企業主題的情感,再加上專業搜尋引擎,使用者能依據主題、組織、地點、人物和話題進行查詢。


利用Newssift搜尋近期外界對零售龍頭沃爾瑪(Wal-Mart)的看法,顯示外界對該公司抱持正面情緒,持正面和反面意見的比重略高於2比1,但將搜尋更精確的縮小至「勞工和工會」時,正面和反面情緒的比重降至1比1。


這些工具可協助企業準確掌握客戶對特定議題的觀點,幫助企業以適合的行銷和公共關係策略,做出回應。


簡單的情感分析工具,如雨後春筍般迅速崛起。


對於一般的網路使用者,簡單的情感分析工具就如雨後春筍般迅速崛起,這些簡單的工具包括Tweetfeel、Twendz和Twitrratr,這些網站可讓使用者了解微型部落格Twitter使用者,針對特定議題情緒反應。


舉例來說,在Tweetfeel進行快速搜索,顯示出近期77%的Twitter使用者喜歡「美味關係」(Julie & Julia)這部電影。


但是在Twitrratr進行相同的搜索,則顯露出一些缺點,該網站將「美味關係真是一部令人愉快的電影!」評定為負面評價,因為網友的評論結尾是「看完這部電影讓人覺得好餓!」系統將「餓」解讀為負面情感。


Scout Labs、Jodange和Newssfit運用更先進的演算法,利用進階分析技術防止上述陷阱,但沒有一款服務工具是完美無瑕的。


法蘭西斯表示,「我們的演算法約有70-80%精確度。」他表示,客戶可重新分類不正確結果,所以系統能從錯誤中學習。


將人類模糊的語句轉化成二進位數值,總會發生一些不完美的事情,但是,位於馬里蘭近郊的顧問公司Alta Plana,其創辦人格萊姆斯(Seth Grimes)指出,「情感十分不同於常見的事實。」


可靠的情感分析,需跨越許多語文的灰色地帶。


格萊姆斯表示,許多文化因素和語言些微差異,很難將文字轉化為純粹的支持或反對情感,如果將「有罪惡感」用來形容巧克力蛋糕,通常暗示著對該產品持有正面情感。


最簡單的演算法係將文字掃描,依照單純的二進位分析,將情感分類為正面和負面,即「喜歡」是正面,而「討厭」就是負面。


但是這種方法無法抓住讓人類語言生動的微妙差異,即帶有諷刺、挖苦、俚語、和其他慣用語的說法。可靠的情感分析需要跨越許多語文的灰色地帶。


雅虎研究員潘波(Bo Pang)表示,「我們正在努力將人類的情感精確的表達。」潘波為「意見探勘與情感分析」(Opinion Mining and Sentiment Analysis;暫譯)一書的共同作者,該書為首批情感分析的教科書之一。為了了解情感的真正含意,潘波研發的軟體考量了許多不同的層面,包括兩極、密度和主題等。



Edited 1 time(s). Last edit at 10/05/2009 09:38PM by HP.
(編輯記錄)