人與人之間說不同語言,尚且會出現溝通障礙,當人類和機器交互時,這種障礙則會變成巨大的鴻溝。毫無疑問,人工智能是時代發展不可逆的技術趨勢,而作為這個時代的核心參與者——人與機器,如何更好地交互始終是待解問題。其中,最關鍵的是讓機器能夠理解人類的語言。

市面上已經出現了大量的自然語言處理(NLP)企業,致力于人機之間的語言交互問題。不過,人工智能企業深度好奇則將研發的重心細化到 NLP 領域的核心——自然語言理解(NLU),以挖掘深度語義理解的商業價值。NLU 旨在把人類語言翻譯成機器可以 “讀懂” 和 “使用” 的形式,即把非結構化的數據變成結構化的、機器容易操作的東西。當文本變成機器可以讀懂的結構化信息時,同一流程上的很多操作就可以讓機器來做,或者讓機器之間進行某種形式的交互。

與 NLP 相比,NLU 更加深度垂直,就像 “深度好奇” 這個名字一樣神秘。該公司的創始人兼 CTO 呂正東,曾任職于微軟亞洲研究院、華為諾亞方舟實驗室,長期從事機器學習和自然語言處理的研究。作為自然語言處理領域的專家,他創業的初衷是做出具有嶄新技術高度的語言智能產品。

不過,由于公司切入點比較深入,呂正東笑稱很多人不理解他們在干什么。“我們希望形成一個完整的行業語義圖譜,一方面,它能夠和其他結構化信息做無縫連接,另一方面,它可以直接輔助行業專家的決策。” 呂正東介紹到,公司的愿景是探索理解人類語言的算法,并且創造服務于行業的人工智能。

據他介紹,深度好奇最開始涉及的領域是法律,現在主要在公安和金融領域中做應用,代表性的例如智能審訊類產品和智能風控產品。以公安相關場景為例,呂正東介紹到,深度好奇有兩大技術框架,一是做復雜文本的解析,即將復雜的文本轉化成語義圖譜;二是基于語義圖譜進行推理,包括圖譜之間的比對、融合、預測、分析等。

案件里的信息主要體現為文本形式的非結構化數據,深度好奇首先需要對文本數據進行結構化,從而串聯整個案件已知和待確認的信息,形成一個完整的語義圖譜,這即是語義解析平臺的功能。此外,深度好奇還有一個推理平臺,可以用來處理語義圖譜與其他信息的融合、比對以及在此之上的預測和行動建議等。需要說明的是,在偵破過程中的很多信息是模糊和待確認的,推理平臺會通過多信息源的比對以及和人的交互,來逐漸完成對信息的豐富和清晰化。隨著事實性信息的不斷完善,該圖譜會變成一個越來越完整和清晰的對案情信息的綜合表征。

呂正東表示,公安場景是 NLU 可以大展拳腳的領域。“其實,在邏輯層上大有可為。之前很多企業已經在感知層上獲得了快速成長,但總的來說,感知層市場的增長已經大幅放緩。” 他認為,公安方面接下來更亟待解決的任務,就是如何在認知層和邏輯層把數據串聯起來形成解決方案。

與醫療領域有著較為相似的痛點,公安領域也面臨著專家資源的缺乏以及與時代的脫節。“新警察缺乏經驗,老警察也在被一個問題所困擾:他的經驗未必能和最新的偵破手段結合。“呂正東說。所以,在這樣的背景下,亟待一個既能融合老警察辦案思路,又能以極速的方式接觸到各種信息、適應最新偵破手段的解決方案。呂正東表示:“目前世界還沒有技術能一開始就做到機器版的福爾摩斯或者狄仁杰,但是我們可以在一些局部進行突破,先提高警察的辦案效率,逐漸就會串聯起一個更完整、更強大的解決方案。”

據悉,深度好奇在公安市場的商業模式目前主要有兩種:其一是將產品直接銷售至公安局,用戶已覆蓋多個縣區級公安局、地市級公安局和省廳;其二是與不同類型的平臺型公司合作,通過他們的渠道進行市場推廣。顯然,深度好奇的技術產品在效果與落地方面均有所成,未來也可能衍生到其他領域。

深度好奇已經于 2016 年底完成了合力資本及阿米巴資本的天使輪融資,目前對于新一輪融資持開放態度。