萬物皆可ChatGPT?
自去年 12 月(美國時間 11 月 30 日)發布以來,ChatGPT 火爆全球,不斷刷屏。從寫郵件、做食譜、寫詩歌、精通十以內加減法,到寫出較高水平的代碼和論文,通過了商科、法學和醫學院的研究生水平考試,再到 ChatGPT 成功通過了谷歌的面試,并拿到了年薪 18 萬美元的 L3 工程師 offer......
瑞士銀行巨頭瑞銀集團的一份報告指出,推出僅兩個月后,ChatGPT 月活用戶已經突破了 1 億,成為史上用戶增長速度最快的消費級應用程序,更是成為一款“現象級”的 AI 產品。
ChatGPT 是 OpenAI 推出的一款對話機器人,也被視為有史以來最好的AI聊天機器人,本質上是一個大規模預訓練語言模型。這是在自然語言模型 GPT-3.5(GPT-3 的升級版)的基礎上進行調整、優化的產品,也是生成式 AI 工具。有業內人士將 ChatGPT 比喻為“搜索引擎+社交軟件”的結合體,能夠通過實時互動獲得問題的答案。
生成式 AI 近期所取得的一系列新突破有可能徹底改變人們內容創作的方式,從編程再到視頻、藝術、寫作、游戲、數學計算到生物醫藥等等。
比爾·蓋茨稱,ChatGPT、 Bing 聊天機器人和谷歌的 AI 聊天機器人 Bard 等模型在全球范圍內開啟了一種新形式的革命。
蒙特利爾高等商學院計算機系的終身副教授唐建在《理解未來》科學講座上表示,生成式 AI 近年來快速取得突破性發展,ChatGPT 則是生成式 AI 快速發展的一個重要里程碑。與其他領域類似,ChatGPT 在生物醫藥領域內有著同樣的機會,理論上我們完全可以開發出生物醫藥領域的“ChatGPT”。
比如說,生成式 AI 在生物醫藥領域有許多應用,包括尋找病因、發現新的藥物靶點以及生成全新的小分子和抗體。
Nature Biotechnology 上的一篇社論文章也指出,生成式 AI 正在生物醫學領域全速前進。
生成式 AI 被視為人工智能皇冠上一顆璀璨的“明珠”,已經在多個領域表現出獨特的價值。該技術始于 2014 年,誕生于 Yoshua Bengio 與 Ian Goodfellow 發表的開創性論文“生成對抗網絡(GAN)”。截止目前,這篇論文被引用了超過 5.5 萬次。
這是一類能根據輸入參數生成新內容的算法,包括無監督和半監督訓練技術,能夠使用已創建的文本、圖像、音頻、視頻和代碼等創建新的內容。與信息分析和處理的 AI 不同,生成式 AI 的出現可能會對多個行業產生更為深遠的影響。生成即創造,該算法的突破也意味著 AI 開始走向了創造新內容的發展路徑。
生成式 AI 模型通常需要在大型數據集上進行訓練學習,并使用機器學習算法生成與訓練數據相似的新內容。該算法在各種應用程序中很有幫助,比如創建藝術、音樂和聊天機器人生成文本等。這種算法模型類型多樣,常見的生成模型包括生成對抗網絡(GAN)、VAE 和自回歸模型。比較有代表性的生成式 AI 模型包括 DALL-E、DALL-E2、ProGen 以及 ChatGPT 等。
Insilico Medicine 創始人兼聯合首席執行官 Alex Zhavoronkov 指出,“生成式 AI 可根據生成條件來生成合成數據,目前已被應用于醫療健康領域的方方面面,從靶點發現、小分子設計、生成合成生物數據、醫療和美容成像等等。任何地方,當你需要在醫療健康領域中使用 ‘AI 想象力’,GANs 就會是忠實的朋友。”
Forbes 上的一篇文章也這樣寫道,類似于 iPhone 等手機快速成為我們生活中不可或缺的一部分,ChatGPT 等先進的生成式 AI 工具將深刻變革醫療健康領域。
首先,ChatGPT 等工具會隨著經驗和計算能力的提高,相應提高敏銳度和準確性。還可以通過學習幫助醫生或者護士行醫就診、預防醫藥差錯等。比方說,下一代 ChatGPT 可能會具備視頻功能,以此觀察醫生和護士,并將其行為和循證指南進行比較,在醫生和護士做出誤判時給出指導。同時,根據監測數據進一步防止用藥錯誤等等。
其次,針對一些慢性疾病,下一代生成式 AI 工具將能夠全天候 24/7 監測患者并提供持續的日常護理。
此外,也可以應用于新藥研發領域,通過學習生成和設計出全新的蛋白質和抗體分子。
生物醫藥領域經歷了多次的變革,基因測序、基因編輯、冷凍電鏡等新技術的發展加速了生物醫藥領域內生物數據的指數級增加,這些數據包括蛋白質數據、抗體序列數據以及結構數據。
上文提到,生成式 AI 模型需要大量的數據和代碼數據進行預訓練。基于大量的生物數據和生成式 AI 的天然屬性,理論上人們完全可以預訓練出一個生物制藥領域的生成式 AI 模型,類似于“ChatGPT”。
唐建在《生命科學中的生成式人工智能:如何搭建生命科學的“ChatGPT”》講座中談到,“生成式 AI 非常適用于藥物發現,尤其是蛋白質、抗體設計,此類型模型可以生成全新的蛋白質和全新的分子,并幫助科學家們發現更好的藥物。以蛋白質設計領域為例,不論是小分子還是蛋白質分子,本質而言都需要生成一些新的結構。通過融入 ChatGPT,可以提升蛋白質設計的創新度和多樣性。”
事實上,科學家們已經嘗試利用 ChatGPT 進行藥物發現,通過分析科學論文、專利和臨床試驗數據識別新的藥物靶點和潛在的藥物相互作用。
阿斯利康在將 ChatGPT 應用于藥物發現的一項研究中表示,ChatGPT 可以識別出傳統方法未發現的新靶點,并展示了生成式 AI 算法在加速藥物發現過程的潛力。
劍橋大學的研究人員利用 ChatGPT 分析科學文獻并確定了一個治療阿爾茨海默病的新靶點;舊金山加利福尼亞大學的研究人員使用 ChatGPT 分析電子健康記錄并識別現實環境中存在的潛在藥物間相互作用關系。
IT 研究與顧問咨詢公司 Gartner 的分析師指出,幾乎所有大型制藥公司和許多小型制藥初創公司已瞄準基于類似于 ChatGPT 的生成式 AI 技術進行新藥研發,并利用其設計針對疾病蛋白質屬性或功能的藥物,一些藥物現在正處于臨床試驗階段。
預計到 2025 年,生成式 AI 將用于發現 30% 的新藥和工業材料。這是制藥業的一個重大變化。
其中,成立于 2020 年的 AI 制藥 Generate Biomedicines 使用生成式 AI 來生成并設計可用作新型療法的蛋白質;2015 年成立的 AI 藥物發現公司 Standigm 也使用生成式 AI 工具通過查詢大型生物醫學數據庫在短短 2 個月內創建了數百種新分子。
視線回到國內,公開資料顯示,Insilico Medicine 是國內一家將生成式 AI 應用于藥物研發領域的 AI 制藥公司,旗下生成化學平臺 Chemistry42 合成多款新型化合物結構,大約幾小時到數十小時可以針對特定蛋白生成新分子;晶泰科技聯合創始人、首席創新官賴力鵬博士也表示,公司目前也有類似的生成算法,主要在 AI 抗體發現等蛋白質生成領域有所應用,底層邏輯也與 ChatGPT 這樣的語言模型有類似之處。
根據相關數據, 2022 年,生成式 AI 領域投資超過 13.7 億美元,隨著該模型在生物醫學領域獲得更多關注,該領域的投資金額可能會進一步持續增加。預計到 2040 年,生成式 AI 可能會為醫療健康行業帶來 1 萬億美元的價值。
ChatGPT 一定程度上引發了業內對于 ChatGPT 以及生成式 AI 算法的熱捧,雖然在醫療健康具有一定的應用潛力,但是真正應用于醫療健康尤其是生物制藥領域還存在一些現實挑戰。
賴力鵬坦言,ChatGPT 是基于大數據大模型,相比以前的類似算法,在文本生成和問答上的應用獲得了質的提升。不過,ChatGPT 在核對事實的能力上仍有局限,目前可以在人的引導下作為效率工具使用。這類工具更適合比較寬泛的邏輯梳理和信息歸納,然而,生物醫藥領域對生成算法的結果有更高、更具體的要求,需要更精確的產出(比如同時具有多個特定性質的小分子或者蛋白質片段),現階段醫藥健康領域還不是 ChatGPT 擅長的方向。
Alex Zhavoronkov 也表示,考慮到 ChatGPT 使用的訓練集和訓練它的 AI 訓練師水平,存在準確性問題,暫時不建議將其直接應用于任何生物醫學領域。我認為,需要考慮醫療領域對準確率和專業知識的要求,更期待開發出在醫療健康領域類似 ChatGPT 的專門系統。
賴力鵬進一步從生成式AI算法角度解釋道,當前,生成AI在生物醫藥領域的主要應用限制在于高質量結構性數據的獲取,以及數據的平衡性(比如,除了獲得發表的成功實驗數據,其實失敗實驗、項目的數據也很重要)。
而生命科學領域對信息的準確、邏輯的嚴謹都有更高的要求,未來如果想在生命科學領域用到 ChatGPT 等生成式 AI 算法,可能需要模型中針對性地處理更多的科學內容,公開數據源,并且投入人力運維,才能讓產出的內容不僅通順,而且正確。
“此外,如何開源分享私有數據、防止濫用和數據偏見也都是類似生成式 AI 工具應用在生命科學領域中需要面對的問題。”賴力鵬說。
Alex Zhavoronkov 認為,在生物制藥領域,現在面臨的真正問題是,人們可能知道所有人類生物學、化學和物理學的 0.1%,但是對于如何改變這些缺乏觀點,因此即使有生成式 AI 的重大進展,也不可能從 0.1% 產生 100% 的知識。
當下,我們更需要做很多的研究和探索。生成式 AI 可能在某種程度上幫助發現靶點、生成分子,甚至從無到有產生一些新穎的想法,但在很長一段時間內,它不會取代實驗。
“ChatGPT 讓我們看到了 AI 在各個領域中幫助人類科學家跳脫個人信息處理能力上限、實現高效創新的潛力。我相信,未來,如果 ChatGPT 等生成式 AI 模型在特定方向的數據上加強訓練,將有機會在特定領域,包括生物制藥領域,大放異彩。”賴力鵬總結道。
本文鏈接:http://www.www897cc.com/showinfo-62-1196-0.htmlChatGPT是生物醫藥發展的新機遇?
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。