用python進行近紅外光譜儀解析
近紅外光譜儀(NIR)是干什么的?
簡單來說就是儀器,拿樣本拍照后會有一個特殊的光譜圖。近紅外光譜儀不僅能反映樣本的分子結構,還能反映一些分子之間的相互作用。所以可以用一些其他的玩法,比如拍照后可以無損檢測橘子的甜度等等。然后此外NIR優點是不需要準備就拿樣本照,結果也很快,總之很方便。
在自動化實驗室中(Self-driving?laboratory)我覺得NIR它應該是不可或缺的一部分。通過建立QSAR/QSPR模型和in?silico?design在設計了新的候補物質后,可以將更好的候補物質扔給機器人合成。合成后,在批量生產的準備階段得到一個NIR合成產品的質量可以控制,也有利于進一步分析和改進工藝。
近紅外光譜儀數據
讓我們來看看數據集是什么樣子的。
這里有67個樣本。根據波長范圍的不同,分為373個部分。
這里的API指相關藥物的有效成分量。由于近紅外光譜儀與有效成分信息密切相關,我們可以通過構建模型來分析有效成分的濃度。
接下來,數據集的有效成分分布可能是這樣的。有點不平衡。
接下來看看光譜圖是什么樣子的。
可以看出,每個樣本的基本趨勢是相似的,但有些高有些低,這反映了不同的濃度。此外,由于光譜圖等數據與時間序列數據有許多相似之處,因此處理時間序列的一些方法也應該在這里展示其技能(目前尚未嘗試)
接下來,用光譜數據構建API預測模型。必須執行光譜數據scaling預處理,測試一些精度會比不處理好。
對嶺回歸和隨機森林進行了測試,評估結果如下
線性模型嶺的回歸似乎比非線性隨機森林要好得多。
這里有一個問題,并不是所有的范圍和光譜圖API高度相關。因此,有必要對光譜的波長頻段進行相應的篩選,以重新構建模型。事實上,這與特征值處理非常相似。首先,我們在這里輸入的波長是一個極高維度的數據,因此我們需要使用類似的特征值來篩選相應有效的波長頻道。
博精科技是一家集R&D、設計、制造、銷售、服務于一體的綜合性創新企業。公司以市場為導向,以人為本,以科技為動力,致力于各種通用分析儀器、R&D、生產和銷售常規實驗儀器、物理光學儀器等產品。主要產品有傅立葉紅外光譜儀儀、紅外測油儀,紅外分光光度計、粉塵中游離二氧化硅含量測定儀、紅外壓片機、手動粉末壓片機、電動粉末壓片機、自動壓片機、壓片模具、溴化鉀窗片實驗裝置等。?我們將與客戶分享先進的分析技術方案和概念,共同享受科技進步帶來的便利和價值,也希望與國內外更多的制造商達成廣泛的合作關系!
標簽tag: