深度學習與微流體學:綜述
微流體學深度學習技術簡介
基于微流體的設備的獨特功能在許多不同的應用領域帶來了巨大的進步,包括實驗生物學和生物醫學研究。然而,這項技術的全部潛力還沒有發揮出來據需要像生成過程一樣高效地進行分析。
在這方面,機器學習是一類基于人工智能(AI)的方法,已被應用于生物技術應用中的數據處理,如液體活檢中的疾病檢測、單細胞脂肪篩查、癌癥篩查、細胞計數和預測油包水乳狀液大小。最近,深度學習顯示了分析圖像或序列等結構化數據的能力。第一個例子是無標簽細胞分類,其中體系結構識別來自預定義特征的細胞或原始圖像作為輸入,利用深度網絡的能力來提取相關特征以改進預測。在這篇綜述中,我們將討論更簡單和更復雜的深度學習體系結構,以分析不同的數據集。
用于生物分析的深度學習體系結構
無標簽細胞分類可以用最簡單的架構實現:非結構化數據到非結構化數據。例如,非結構化輸入可以是細胞特性的矢量(圓度、周長和長軸長度),并且軸可以是細胞類型/類別。一個例子是喬治亞理工學院Hang Lu團隊在微流控芯片中對線蟲的定位和定向,該芯片用于對生物體中的突觸小點模式進行成像。在Vasilevich等人的優秀評論中描述了另一個有趣的應用。
圖1:固定在微流控芯片中的線蟲突觸部位的熒光顯微照片。
其他深度學習神經網絡能夠處理順序數據,例如由微流控設備產生的數據。這些類型的網絡稱為遞歸神經網絡(RNN),可以根據它們的輸出進一步劃分:從順序到非結構化的數據體系結構在接收到順序輸入后產生單一輸出。序列是其中元素的順序很重要的矢量(例如,序列或圖像),而對于非結構化數據,元素的順序并不重要(例如,細胞特性的矢量-寬度、長度等)。在序列到非結構化架構的情況下,訓練是通過一種稱為時間反向傳播的技術來實現的。例如,這可用于表征微流控軟測量,以解決其局限性,如響應的非線性和滯后。Das等人在校準階段應用深度學習來同時估計接觸壓力的大小和位置。他們制造了兩個不同的傳感器來獲取數據,一個有一個單一的直線微通道,在三個部分中有三個不同的橫截面面積,另一個有一個單一大小的微通道,但在不同的位置有三個圖案。實驗是通過在傳感器的更多位置以不同的速度和壓力壓縮頂面來進行的。由模塊化網絡組成的RNN算法能夠對壓力響應具有滯后性的非線性特性進行建模,并能找到壓力的位置。
圖2:不同設計和截面的軟壓力傳感器
另一方面,序列到序列神經網絡提供序列數據作為輸出。DNA堿基調用就是一個例子:Minion納米孔測序平臺,這是一種高通量DNA測序儀,可以在數據產生時進行實時分析。從這種類型的神經網絡中受益的應用是那些可以通過考慮先前的測量來提高精度的應用,例如通過體積或質量的細胞生長。例如,每個脈沖幅度對應于細胞的通過,這意味著輸入序列的每個元素都被注釋。
圖像可以使用深度學習網絡進行分析,深度學習網絡可以處理空間分布的數據。這帶來了對細胞分類的進一步改進,并且可以直接完成,而不需要事先人工提取特征。用于處理圖像的神經網絡稱為卷積神經網絡(CNN)。用于分析圖像的元素是卷積塊,其可以被描述為沿圖像滑動并且在處理的圖像區域內輸出該過濾器的像素值的加權和并應用非線性變換的過濾器。這些卷積層提取特征映射中最主要的值。一個例子是應用深度學習CNN來高通量地對淋巴細胞和紅細胞的二元組進行分類。
圖像到圖像的神經網絡被用于許多應用中,但由于從細胞輪廓開始生成完全分割的圖像的可能性,圖像分割是一個日益增長的感興趣的領域。例如,在神經細胞分割應用中,目標是將輸入圖像中的每個像素映射到語料庫中存在的許多類別中的一個。神經細胞圖像被分割成標記軸突(藍色)、髓鞘(紅色)和背景(黑色)的區域
圖3:圖像和相應輸出標簽的示例:軸突(圖中的藍色)、髓鞘(紅色)和背景(黑色)
視頻處理和深度學習
這些不同的方法可以一起用于分析視頻,例如Buggenhim和他的同事使用RNN和CNN的組合來識別造血系,實際上他們可以在細胞表達常規分子標記之前預測細胞的分化。第一步通過應用CNN從亮場圖像中提取特征,然后利用RNN對這些數據進行處理,通過考慮之前的幀來及時跟蹤信息。
具有深度學習網絡的器官芯片(OOC)和人工智能自主生命系統
深度學習算法可能會對像芯片器官這樣更復雜的系統產生巨大影響。OOC是一種3D微流體設備,它提供了復制組織或整個器官并研究它們的活動和環境的可能性。隨著OOC設備的不斷發展,大量數據將從組織和器官在其體外環境中發育的圖像和視頻饋送到深度學習網絡;此外,可以通過類似于現代組織病理學分析的方式分析大部分組織和器官以檢測空間異質性。CNN已經被用來組織和分類組織形態信息,因此也可以用來分析芯片上組織培養的熒光顯微圖像。
圖4:使用經過訓練的CNN對1024×1024像素圖像塊進行自動平鋪和分類,可以用棕色觀察到病變定位的全局概況
深度學習網絡可以在新興的多器官系統領域實施,以監測單個器官,評估它們的通信,提供對多個OOC系統的實時控制;非常有趣的是,這也可能導致一個可以自我調節的多器官系統。
用于實驗設計和控制的深度學習
深度學習可能是研究需要并行化和控制多因素的復雜環境的一個很好的資源。Zymerg開發了一個網絡,可以控制數千種平行的基于微孔的培養,其中的算法處理微流控決定,如注射什么和何時注射。使用深度學習網絡進行實驗計劃和實驗后分析的一個例子是Nguyen和他的同事的研究,在該研究中,不同的因素,如溫度、光線、食物供應和各種污染物,可以評估它們對微藻生長的影響。
圖5:微生理系統平臺及其流程劃分
基于云的深度學習
微流控醫療點診斷學、食品安全、抗體生產、療法、疫苗和供應鏈是可以從深度學習網絡的整合中受益的領域。通過向網絡提供全球分布的數據,例如,通過基于紙張的分析生成的數據,深度學習算法可以跟蹤、預測并最終控制疫情。
總結
在這篇簡短的綜述中,介紹了可以整合深度學習網絡的不同生物技術應用。特別是,微流體學和深度學習算法的結合具有巨大的潛力,可以分析由高度并行化的系統產生的越來越多的數據,這可能會以強大的方式加速研究。最后,在實驗室中集成這項技術帶來了相對較低的挑戰和成本
標簽:   微流體