當(dāng)前位置:島津企業(yè)管理(中國(guó))有限公司>>公司動(dòng)態(tài)>>島津、富士通、富士通研究所共同研究成果:人工智能在質(zhì)譜數(shù)據(jù)處理中的應(yīng)用
島津、富士通、富士通研究所共同研究成果:人工智能在質(zhì)譜數(shù)據(jù)處理中的應(yīng)用
株式會(huì)社島津制作所(以下簡(jiǎn)稱“島津制作所”)、富士通株式會(huì)社(以下簡(jiǎn)稱“富士通”)、株式會(huì)社富士通研究所(以下簡(jiǎn)稱“富士通研究所”)經(jīng)共同研究※1,成功開發(fā)出可應(yīng)用于大數(shù)據(jù)處理中的AI(人工智能)技術(shù),該技術(shù)在質(zhì)譜分析結(jié)果的解析過程中*。截至目前的所有研究成果,已在日前召開的“第11屆代謝組學(xué)研討會(huì)”上發(fā)表。
作為ICT(信息通信技術(shù))企業(yè),富士通為實(shí)現(xiàn)數(shù)字革新,不斷探究AI新型商業(yè)模式。作為分析儀器制造商,島津公司受客戶委托,致力于“實(shí)現(xiàn)復(fù)雜數(shù)據(jù)的高精度自動(dòng)解析”。訴求一致的兩家企業(yè)自去年11月起,開始推進(jìn)數(shù)據(jù)自動(dòng)化解析領(lǐng)域AI的共同研究。隨著儀器靈敏度、分析速度的不斷提升,用于疾病早期發(fā)現(xiàn)的技術(shù)確立、食品農(nóng)殘檢測(cè)等各領(lǐng)域研究以及品質(zhì)管理等用途的質(zhì)譜分析儀,獲得的數(shù)據(jù)量也急劇增加。在此影響下,被稱為“peak picking ”※2的數(shù)據(jù)解析方式成為作業(yè)工程中的一大瓶頸。由于較難實(shí)現(xiàn)*的自動(dòng)化,并且在一定程度上仍需手動(dòng)調(diào)整,該作業(yè)方式存在操作人員操作失誤或數(shù)據(jù)篡改的漏洞,各操作人員間的解析準(zhǔn)確率亦參差不齊。近年,在醫(yī)療及制藥領(lǐng)域,對(duì)排除屬人為屬性的高精度自動(dòng)化需求愈演愈烈。
為此,3家企業(yè)模仿腦神經(jīng)細(xì)胞的神經(jīng)網(wǎng)DEEP LEARNING(深度學(xué)習(xí))的適用性開展探討,欲通過活用AI解決上述問題。但在研究過程中,遇到兩大難題:其一, 訓(xùn)練數(shù)據(jù)※3不充分;其二,將分析儀器輸出數(shù)據(jù)直接導(dǎo)入深度學(xué)習(xí)網(wǎng)絡(luò)后,無法開展學(xué)習(xí)訓(xùn)練。通過共同研究期間的不懈努力,島津成功開發(fā)出“可彌補(bǔ)訓(xùn)練數(shù)據(jù)不足的數(shù)據(jù)生成技術(shù)”,富士通?富士通研究所成功開發(fā)出“分析儀器輸出特征的圖像轉(zhuǎn)換技術(shù)”及“可學(xué)習(xí)熟練工解析訣竅的特征提取技術(shù)”。目前,已將通過上述技術(shù)生成的3萬多條訓(xùn)練數(shù)據(jù)輸入深層學(xué)習(xí)網(wǎng),供其學(xué)習(xí)。
與經(jīng)驗(yàn)者手動(dòng)peak picking 結(jié)果比對(duì)后發(fā)現(xiàn),AI自動(dòng)peak picking 的錯(cuò)誤率為7%、未檢率為9%※4。即自動(dòng)peak picking 并不遜色于經(jīng)驗(yàn)者操作,相關(guān)結(jié)果達(dá)到可使用狀態(tài)。
在島津公司2017年4月開展的中期經(jīng)營(yíng)計(jì)劃中,制定了“致力先進(jìn)醫(yī)療、為預(yù)防、診斷、治療以及制藥領(lǐng)域提供革新產(chǎn)品及服務(wù)”的目標(biāo)。本次開發(fā)的AI,其zui初使用的“代謝組學(xué)”研究即為其中的一環(huán)。代謝組學(xué)是一種檢測(cè)代謝產(chǎn)物并根據(jù)其性狀特征對(duì)細(xì)胞開展檢查的生物技術(shù)。在生理?病理組織的解析、疾病生物標(biāo)志物的探索等領(lǐng)域備受矚目。
2015年11月,富士通將積累了超過30年的AI(人工知能)相關(guān)知識(shí)技術(shù),以“FUJITSU Human Centric AI Zinrai”形式公開發(fā)表,積極推進(jìn)面向各領(lǐng)域用戶、商品服務(wù)的AI實(shí)際應(yīng)用。目前,又在深度學(xué)習(xí)的全新領(lǐng)域聚焦“代謝組學(xué)”,積極開展可實(shí)現(xiàn)數(shù)據(jù)分析自動(dòng)化的AI研發(fā)。
島津與富士通的目標(biāo)為,2018年能將本次成功研發(fā)的AI技術(shù)導(dǎo)入質(zhì)譜分析儀器軟件。
※1 從大阪大學(xué)研究生院工學(xué)研究專業(yè)福崎英一郎教授、該校信息科學(xué)研究專業(yè)松田史生教授處獲得研究人員需求。在島津制作所、大阪大學(xué)開設(shè)以代謝組學(xué)分析技術(shù)研發(fā)為目的的“大阪大學(xué)?島津分析革新共同研究講座”。
※2 從質(zhì)譜分析數(shù)據(jù)(圖表)中,讀取峰寬及峰高的工程。
※3 供深度學(xué)習(xí)網(wǎng)絡(luò)開展學(xué)習(xí)的數(shù)據(jù)。對(duì)輸入網(wǎng)絡(luò)的數(shù)據(jù)及其輸出結(jié)果進(jìn)行編組。本技術(shù)應(yīng)用中,為分析儀器輸出數(shù)據(jù)與相應(yīng)經(jīng)驗(yàn)者peak picking 結(jié)果的比對(duì)組合。
※4 將經(jīng)驗(yàn)者手動(dòng)peak picking 結(jié)果稱作“正確范圍”,與AI自動(dòng)peak picking 結(jié)果“預(yù)測(cè)范圍”進(jìn)行比較。如兩者重疊率超過50%,則判斷為“匹配”,反之則為“不匹配”。在“匹配”情況下,除被正確檢測(cè)的峰值外,將預(yù)測(cè)范圍中出現(xiàn)、但無法與正確范圍匹配的項(xiàng)目定義為“錯(cuò)誤檢測(cè)”,將正確范圍中出現(xiàn)、但無法與預(yù)測(cè)范圍匹配的項(xiàng)目定義為“未檢測(cè)”。錯(cuò)誤檢測(cè)率計(jì)算公式為:錯(cuò)誤檢測(cè)數(shù) / (檢測(cè)數(shù)+錯(cuò)誤檢測(cè)數(shù))、未檢測(cè)率計(jì)算公式為:未檢測(cè)數(shù) / (檢測(cè)數(shù)+未檢測(cè)數(shù))。
關(guān)于島津
島津企業(yè)管理(中國(guó))有限公司是(株)島津制作所于1999年100%出資,在中國(guó)設(shè)立的現(xiàn)地法人公司,在中國(guó)全境擁有13個(gè)分公司,事業(yè)規(guī)模不斷擴(kuò)大。其下設(shè)有北京、上海、廣州、沈陽(yáng)、成都分析中心,并擁有覆蓋全國(guó)30個(gè)省的銷售代理商網(wǎng)絡(luò)以及60多個(gè)技術(shù)服務(wù)站,已構(gòu)筑起為廣大用戶提供良好服務(wù)的完整體系。本公司以“為了人類和地球的健康”為經(jīng)營(yíng)理念,始終致力于為用戶提供更加先進(jìn)的產(chǎn)品和更加滿意的服務(wù),為中國(guó)社會(huì)的進(jìn)步貢獻(xiàn)力量。