新科技速遞
IBM的Watson是全球最先進的NLP 領域的領導技術,IBM 宣佈推出數項IBM Watson 技術,以讓企業清晰識別、理解和分析英語中最具挑戰的部分,進而獲得更多洞察資訊。
IBM Watson 技術從較早前與人類作公開辯論的Project Debater,衍生而開發的自然語言處理(Natural Language Processing,NLP)能力再加以商業化。
Project Debater 由IBM研究院(IBM Research)研發,是目前唯一能夠對複雜話題與人類展開辯論的人工智慧系統。IBM 首次界定一項新型進階情緒分析能力,以識別及分析習慣用語和口語化表達。對於人工智慧而言,識別如「hardly helpful(幾乎沒有幫助)」或「hot under the collar(怒氣衝天)」之類的短語,一直是挑戰,因為難以被演算法識別。
通過進階情緒分析,可使用 Watson 應用程式介面(API)來分析此類語言資料,進而更全面地瞭解營運情況。IBM 還將 IBM 研究院的技術,應用於理解及分析諸如 PDF 文件和合約之類的商業文件,並將這些技術增加到 IBM 人工智慧模型。
IBM Data and AI總經理 Rob Thomas 表示:「語言既是表達思想和觀點的工具,也是傳遞資訊的工具。正因如此,我們將Project Debater中獲得的技術整合到Watson,我們相信 NLP 將增強企業從人類語言中獲取、分析和理解資訊的能力,這將有助於企業更好地利用蘊含藏在資料中的智慧資產。」
情緒分析識別組合
IBM 宣佈將 Project Debater 技術整合至 Watson,提高客戶使用自然語言能力,包括進階情緒分析(Advanced Sentiment Analysis),以IBM 增強情緒分析能力,能夠更好地識別和理解複雜的單詞組合,例如像包含短語和表達的習慣用語以及情緒轉換片語(sentiment shifter),即由不同單詞組成但卻呈現新含義的單詞組合,例如「hardly helpful(幾乎沒有幫助)」。
上述情緒分析技術整合至Watson Natural Language Understanding ;Watson加進一項分類技術,分類採購合約等商業文件中出現的條款。基於 Project Debater 中的深度學習輔助式分類技術(deep learning-based classification technology),從數百個範例中學習,進而快速、輕鬆執行新分類。
另外,Watson可執行摘要和總結(Summarization),從各種來源中提取文本資料,協助使用者就特定主題相關的口頭和書面語,歸納為一份摘要。今年的美國格林美獎(Grammy Awards)頒獎典禮,透過Summarization 分析超過 1,800 萬篇文章、部落格和個人檔案,歸納關於數百名格林美獎藝術家和名人專輯。隨後,資料應用到 www.grammy.com 的紅毯視訊直播、隨選視訊以及照片。
另一項先進自然語言技術則是群集—進階主題群集(Advanced Topic Clustering),可對輸入資料,進行「群集」分類,就相關資訊創建有意義「主題」,隨後可深入分析各主題歸類。IBM自然語言處理NLP可開發創新技術,支援電腦準確、快速地學習、分析及理解人類語言;包括了感情色彩、方言、語調等等。IBM 的Watson 透過NLP 技術,已應用於文書理解的 Watson Discovery、用於虛擬代理的 IBM Watson Assistant以及用於進階情緒分析的Watson Natural Language Understanding, NLP。
語言處理用途廣
ESPN Fantasy Football使用Watson Discovery和Watson Knowledge Studio分析賽季中每天產生的數以百萬計足球資料來源;透過處理自然語言,Watson識別新聞文章、部落格、論壇、排名、預測、Podcast和Twitter等內容的語氣和情緒,涵蓋從更衣室洞察到傷病分析等全方位的內容。ESPN Fantasy Football在球員卡中展示訊息,球員卡也記錄了每個球員的升/降級(Boom/Bust)潛力,以及「球員的關鍵球能力(Player Buzz)」部分,總結球員正面或負面評論。
畢馬威(KPMG)會計師事務所與IBM合作創建了一個基於Watson多種服務的人工智能方案,包括Watson Natural Language Understanding等,助企業有效識別、申報和留存諸如潛在寬免利得稅的研發成本。方案由畢馬威開發,Watson減少了審查文件時對業務干擾、快速審查更多文檔,幫助增加獲得從研發費利得稅的寬免額。
過去一年,上述項目的審查文件數量,甚至增加1000%以上,幫助客戶發現有資格獲額外利得稅寬免的潛在研發活動,減少工程師和科學家用於填寫寬 利得稅合規文件的時間。