Anthropic讓Claude學(xué)化學(xué),鷹谷已經(jīng)把AI化學(xué)家裝進(jìn) InDraw 和 InPaper
AI 正在從“會(huì)說(shuō)話”,走向“懂科研”。

過(guò)去幾年,大模型主要解決的是語(yǔ)言問(wèn)題;而未來(lái)幾年,真正決定科研AI價(jià)值的,將是它是否能夠理解科學(xué)語(yǔ)言、實(shí)驗(yàn)邏輯和專業(yè)知識(shí)體系。
而這,也正是鷹谷過(guò)去十余年持續(xù)投入的方向。
一、Anthropic正在讓AI“讀懂化學(xué)”
長(zhǎng)期以來(lái),大語(yǔ)言模型優(yōu)勢(shì)在于自然語(yǔ)言處理。
它們能夠?qū)懳恼?、總結(jié)資料、生成代碼,卻很難真正理解化學(xué)結(jié)構(gòu)、實(shí)驗(yàn)數(shù)據(jù)以及復(fù)雜的科研知識(shí)。原因很簡(jiǎn)單:化學(xué)并不是普通語(yǔ)言。
一個(gè)分子結(jié)構(gòu)、一張譜圖、一條反應(yīng)路線,本質(zhì)上都是高度專業(yè)化的信息表達(dá)體系。如果AI無(wú)法理解這些信息,就無(wú)法真正參與科研工作。在《Making Claude a Chemist》中,Anthropic展示了多個(gè)重要方向:
化學(xué)結(jié)構(gòu)理解
NMR譜圖解析
科學(xué)文獻(xiàn)閱讀與推理
這些能力意味著:AI正在從“生成內(nèi)容工具”升級(jí)為“科研認(rèn)知工具”。未來(lái)科研AI的競(jìng)爭(zhēng),可能不再是誰(shuí)擁有更多參數(shù),而是誰(shuí)真正理解:化學(xué)語(yǔ)言、實(shí)驗(yàn)邏輯、科學(xué)知識(shí)、科研數(shù)據(jù),而這些能力,恰恰是科研場(chǎng)景長(zhǎng)期存在的核心痛點(diǎn)。
二、這些能力,鷹谷早已做進(jìn)真實(shí)科研工具
事實(shí)上,如果仔細(xì)觀察 Anthropic 所展示的方向,會(huì)發(fā)現(xiàn)其中許多能力與鷹谷長(zhǎng)期布局的方向高度重合。區(qū)別在于:Anthropic 正在探索讓大模型具備這些能力;而鷹谷已經(jīng)把這些能力做成科研人員每天都能使用的工具。
InDraw:讓AI真正理解化學(xué)結(jié)構(gòu)
在科研工作中,化學(xué)結(jié)構(gòu)是最基礎(chǔ)也是最核心的信息載體。然而長(zhǎng)期以來(lái),大模型對(duì)結(jié)構(gòu)式的理解能力非常有限。為了解決這一問(wèn)題,鷹谷持續(xù)深耕化學(xué)智能技術(shù),并將相關(guān)能力全面融入 InDraw AI 化學(xué)設(shè)計(jì)平臺(tái)。
AI化學(xué)結(jié)構(gòu)識(shí)別:高精度(99.75%準(zhǔn)確度,基于IUPAC、uob 、 uspto、 jpo 、clef測(cè)試集)結(jié)構(gòu)式圖像識(shí)別、批量結(jié)構(gòu)圖識(shí)別、移動(dòng)端拍照識(shí)別結(jié)構(gòu)式、PPT、論文圖片直接識(shí)別,科研人員只需拍照,即可快速獲得可編輯結(jié)構(gòu)。
AI實(shí)驗(yàn)路線設(shè)計(jì):相比識(shí)別結(jié)構(gòu),更重要的是理解結(jié)構(gòu)。InDraw 已將 AI 智能體能力深度融入結(jié)構(gòu)式編輯器。不同于通用大模型依靠語(yǔ)言概率生成答案,InDraw 會(huì)結(jié)合真實(shí)反應(yīng)數(shù)據(jù)庫(kù)與專業(yè)算法進(jìn)行搜索驗(yàn)證:推薦關(guān)鍵反應(yīng)步驟、提供反應(yīng)物與催化劑建議、給出溫度、時(shí)間、加料順序等實(shí)驗(yàn)條件,實(shí)現(xiàn)從“設(shè)計(jì)分子”到“設(shè)計(jì)實(shí)驗(yàn)”的跨越。
圖注:該功能將于InDraw 8.1正式上線
化學(xué)知識(shí)計(jì)算與預(yù)測(cè):InDraw 同時(shí)集成大量專業(yè)化學(xué)工具:中文IUPAC命名、英文IUPAC命名、pKa預(yù)測(cè)、ADMET成藥性預(yù)測(cè)、3D結(jié)構(gòu)模擬、HELM大分子編輯、期刊繪圖能力、兼容 ChemDraw、Office 與 WPS等,對(duì)于科研人員而言,這些能力已經(jīng)不僅僅是畫圖工具,而是逐步演化為化學(xué)研發(fā)工作臺(tái)。

InPaper:讓AI真正理解科研文獻(xiàn)
如果說(shuō) InDraw 解決的是化學(xué)結(jié)構(gòu)理解問(wèn)題,那么 InPaper 解決的則是科研知識(shí)理解問(wèn)題。
科研的知識(shí)來(lái)源依然是文獻(xiàn)。然而大量文獻(xiàn)知識(shí)長(zhǎng)期處于非結(jié)構(gòu)化狀態(tài):數(shù)據(jù)隱藏在正文中、結(jié)構(gòu)式存在于圖片里、反應(yīng)條件散落于實(shí)驗(yàn)部分、生物活性數(shù)據(jù)難以統(tǒng)一整理,即使有大模型,也很難直接利用這些知識(shí)。因此,鷹谷推出了 InPaper 文獻(xiàn)結(jié)構(gòu)化平臺(tái)。
自動(dòng)提取科研知識(shí):InPaper 能夠自動(dòng)識(shí)別并提?。夯瘜W(xué)結(jié)構(gòu)式、化學(xué)反應(yīng)式、生物活性數(shù)據(jù)等數(shù)據(jù),將原本難以利用的文獻(xiàn)信息轉(zhuǎn)化為結(jié)構(gòu)化科研資產(chǎn)。
建立企業(yè)專屬知識(shí)庫(kù):通過(guò)持續(xù)積累文獻(xiàn)數(shù)據(jù),可以快速建立:可全文搜索、結(jié)構(gòu)式和反應(yīng)式搜索的文獻(xiàn)數(shù)據(jù)庫(kù)、文獻(xiàn)構(gòu)效關(guān)系數(shù)據(jù)庫(kù),讓企業(yè)過(guò)去沉睡在文獻(xiàn)中的知識(shí)真正變得可搜索、可分析、可復(fù)用。
對(duì)于未來(lái)AI科學(xué)家而言,這些知識(shí)庫(kù)正是其持續(xù)學(xué)習(xí)與推理的重要基礎(chǔ)。
三、未來(lái)科研AI競(jìng)爭(zhēng)的核心,不只是模型
過(guò)去幾年,行業(yè)討論最多的是模型參數(shù)規(guī)模。但越來(lái)越多實(shí)踐證明:參數(shù)并不直接等于科研能力。真正決定科研AI價(jià)值的,往往是以下幾個(gè)因素:
是否理解專業(yè)領(lǐng)域語(yǔ)言
化學(xué)結(jié)構(gòu)、譜圖、反應(yīng)式,本質(zhì)上都是專業(yè)語(yǔ)言。AI必須先理解這些語(yǔ)言,才能參與科研。
是否擁有真實(shí)科研場(chǎng)景
科研不同于通用辦公,實(shí)驗(yàn)失敗、反應(yīng)異常、數(shù)據(jù)缺失、條件優(yōu)化等問(wèn)題,都需要長(zhǎng)期場(chǎng)景積累。
是否擁有高質(zhì)量科研數(shù)據(jù)
未來(lái)科研競(jìng)爭(zhēng),本質(zhì)上也是數(shù)據(jù)競(jìng)爭(zhēng)。誰(shuí)擁有更多真實(shí)、完整、結(jié)構(gòu)化的實(shí)驗(yàn)數(shù)據(jù),誰(shuí)就擁有訓(xùn)練下一代科研AI的基礎(chǔ)。
是否擁有高質(zhì)量的陰性數(shù)據(jù)
成功數(shù)據(jù)告訴AI什么可行,而陰性數(shù)據(jù)則告訴AI什么不可行。在藥物研發(fā)、化學(xué)合成和新材料研發(fā)中,大量失敗實(shí)驗(yàn)往往比成功結(jié)果更具訓(xùn)練價(jià)值。
是否能夠形成知識(shí)體系
單個(gè)模型能力終究有限。真正重要的是:數(shù)據(jù)、知識(shí)、工具和智能體之間能否形成閉環(huán)。從實(shí)驗(yàn)數(shù)據(jù),到文獻(xiàn)知識(shí),再到智能體推理與執(zhí)行,最終構(gòu)建完整的科研智能基礎(chǔ)設(shè)施。
四、Anthropic 下場(chǎng)科研,垂直領(lǐng)域科研軟件的機(jī)會(huì)在哪里
每當(dāng)大模型能力升級(jí),總會(huì)有人提出同一個(gè)問(wèn)題:
很多軟件公司都被大模型替代了,Anthropic等開始進(jìn)入科研領(lǐng)域后,鷹谷這樣的專業(yè)垂直領(lǐng)域的科研軟件公司還有機(jī)會(huì)嗎?
答案或許恰恰相反:AI進(jìn)入科研領(lǐng)域,反而驗(yàn)證了科研智能化正在成為未來(lái)的重要方向。大模型升級(jí)導(dǎo)致創(chuàng)業(yè)公司被替代,在軟件研發(fā)板塊確實(shí)頻繁上演,但在化學(xué)科研領(lǐng)域,這套邏輯并不適用,反而會(huì)相互協(xié)同,促進(jìn)超級(jí)AI科學(xué)家更快速實(shí)現(xiàn)。
1. 語(yǔ)言模型不等于化學(xué)、物理和生物模型
目前大模型理解化學(xué)的主要橋梁是 SMILES 線性字符串,但這種表達(dá)方式將三維分子構(gòu)象、電子效應(yīng)、空間位阻等信息全部壓縮為一串字符,信息丟失是結(jié)構(gòu)性的。面對(duì)反應(yīng)選擇性預(yù)測(cè)、催化劑設(shè)計(jì)等需要深度化學(xué)理解的任務(wù),通用大模型容易犯“看起來(lái)合理、實(shí)際錯(cuò)誤”的低級(jí)錯(cuò)誤。大模型要理解化學(xué)、物理和生物,還要在底層算法和數(shù)據(jù)上持續(xù)深度研究,才會(huì)有更大的突破。
2. 公開數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠
互聯(lián)網(wǎng)擁有海量文本數(shù)據(jù),但化學(xué)、生物醫(yī)藥領(lǐng)域真正高質(zhì)量的科研數(shù)據(jù)其實(shí)十分有限。尤其是實(shí)驗(yàn)數(shù)據(jù)。大量有價(jià)值的數(shù)據(jù),并不在公開論文和數(shù)據(jù)庫(kù)中,而是沉淀在企業(yè)實(shí)驗(yàn)室、高校課題組和科研機(jī)構(gòu)的日常研發(fā)過(guò)程中。更重要的是,公開發(fā)表的往往是成功結(jié)果,而大量失敗實(shí)驗(yàn)、條件優(yōu)化記錄和陰性數(shù)據(jù)通常不會(huì)被公開。
但對(duì)于AI而言:知道什么有效很重要,知道什么無(wú)效往往更重要。未來(lái)科研AI的競(jìng)爭(zhēng),不僅是誰(shuí)擁有更多成功數(shù)據(jù),更是誰(shuí)保存了更多真實(shí)的失敗數(shù)據(jù)。
而這正是鷹谷電子實(shí)驗(yàn)記錄本InELN 的價(jià)值所在。實(shí)驗(yàn)過(guò)程中的原始數(shù)據(jù)、優(yōu)化過(guò)程以及陰性數(shù)據(jù)都能夠被完整記錄和持續(xù)積累,形成企業(yè)最寶貴的科研數(shù)據(jù)資產(chǎn),也成為未來(lái)AI科學(xué)家的重要基礎(chǔ)。
3. 未來(lái)屬于“大模型 + 專業(yè)系統(tǒng)”
Anthropic 展示的是科研AI發(fā)展的重要方向。但從“理解化學(xué)”到“做好科研”,仍然需要專業(yè)系統(tǒng)的支撐。大模型擅長(zhǎng)理解與推理,專業(yè)系統(tǒng)負(fù)責(zé)沉淀數(shù)據(jù)、構(gòu)建知識(shí)和連接真實(shí)科研場(chǎng)景。兩者不是替代關(guān)系,而是協(xié)同關(guān)系。
對(duì)于鷹谷而言,Anthropic 等模型的發(fā)展并不是威脅,而是機(jī)遇。InELN、InDraw、InPaper 等長(zhǎng)期積累的數(shù)據(jù)、知識(shí)和場(chǎng)景能力,恰恰能夠與不斷進(jìn)步的大模型結(jié)合,共同推動(dòng)下一代AI科學(xué)家的誕生。
AI入場(chǎng),恰恰驗(yàn)證了這條道路
當(dāng) Anthropic 開始研究如何讓 Claude 成為一名“化學(xué)家”時(shí),這不僅意味著 AI for Science 正在進(jìn)入新的階段,也說(shuō)明整個(gè)行業(yè)正在朝著同一個(gè)方向發(fā)展:讓AI真正理解科學(xué),讓超級(jí)AI科學(xué)家更快到來(lái)。
而對(duì)于鷹谷來(lái)說(shuō),這條路并非剛剛開始。從 InELN 沉淀真實(shí)實(shí)驗(yàn)數(shù)據(jù),到 InDraw 理解化學(xué)結(jié)構(gòu)與反應(yīng),再到 InPaper 構(gòu)建科研知識(shí)體系,鷹谷長(zhǎng)期布局的核心始終沒(méi)有改變:
讓科研數(shù)據(jù)變成知識(shí),讓知識(shí)驅(qū)動(dòng)AI,讓AI服務(wù)科學(xué)發(fā)現(xiàn),打造超級(jí)AI科學(xué)家。
免責(zé)聲明
- 凡本網(wǎng)注明“來(lái)源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來(lái)源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
手機(jī)版
化工儀器網(wǎng)手機(jī)版
化工儀器網(wǎng)小程序
官方微信
公眾號(hào):chem17
掃碼關(guān)注視頻號(hào)











采購(gòu)中心