为什么使用机器学习辅助分析?
由于细胞计数领域技术的进步,我们现在能够在单个细胞水平上同时测量许多参数。数据集的维度从传统的4-5色低参数增加到10-20色或更多色,并有几种市售仪器。每个实验的样本数量在事件数量和收集的样本数量方面也越来越大。这给数据管理、协作以及数据可视化和分析带来了挑战。许多机器学习算法工具都是为降维和聚类而开发的,以处理这种增加的数据复杂性。
图 1.双轴图的比较和流式细胞术数据的机器学习分析。N x N 图视图的 20 色面板细胞术数据产生 190 个图,面板 A. viSNE(或 t-SNE)图视图的相同数据,在单个地图(面板 B)上可视化 24 参数信息。
分层门控中的主观性
在基于将门放置在细胞亚组群体的手动数据分析中,已经确定门放置的主观性是流式细胞术研究变异性的原因之一1。对于大型研究,一些小组试图通过集中式手动门控来解决这个问题,在研究小组中创建专门的角色2。这种方法难以扩展,在分析中造成了瓶颈。降低人类在分析中的主观性的方法被视为流式细胞术领域的下一波创新浪潮。
数据分析和解释挑战
在对流式细胞术师探索多色流式细胞术主题的调查中,超过一半的受访者提到了数据分析和解释方面的挑战。大多数在研究方法中使用流式细胞术的科学家都在使用现成的分析软件,其中大部分尚未开发出来以满足多色流式细胞术数据集日益增长的需求。
在《色度爆炸:多参数流式细胞术的发展和未来》一书中,作者描述了最不发达的流式细胞术技术是数据分析。3这是继续推进该领域的最大潜力和最需要的地方。
图 2.多色流式细胞术调查。在2019年12月进行的一项用户调查中,581名流式细胞术研究人员回答了与数据分析相关的主题。小组A显示了表示数据分析或结果解释的受访者比例在他们的多色流式细胞术实验中具有挑战性。图B显示了机器学习辅助分析的经验水平,49%的受访者正在使用或计划在其多色流式细胞术实验中使用ML辅助分析。
Cytobank平台提供了一个平易近人且全面的数据分析工作流程。使用任何支持 Web 的设备在云中执行分析,包括使用内置算法,无需编码或 R 脚本。带有视频和分步说明的学习中心可帮助用户开始使用该平台,在线知识存储库包括文章,提示和技巧以及用于回答问题的支持请求表单。
在我们的应用说明中了解更多关于机器学习算法的信息,使用 20 色免疫表型对细胞子集组成提供深入的见解。
数据分析资源
参考文献
- Maecker HT, Rinfret A, D'Souza P, Darden J, Roig E, Landry C, et al. Standardization of cytokine flow cytometry assays. BMC Immunol 2005 Jun 24;6:13.
- Finak, Greg et al. “Standardizing Flow Cytometry Immunophenotyping Analysis from the Human ImmunoPhenotyping Consortium.” Scientific reports vol. 6 20686. 10 Feb. 2016, doi:10.1038/srep20686
- Chattopadhyay PK, Hogerkorp CM, Roederer M. A chromatic explosion: the development and future of multiparameter flow cytometry. Immunology. 2008;125(4):441–449. doi:10.1111/j.1365-2567.2008.02989.x