我能在研究结束时获得多少数据?


现代流式细胞术研究,特别是在免疫学领域,涉及到项目的复杂性不断增加;科学家们通常跨多个机构合作,每次实验获取大量样本,并随着时间的推移跟踪许多患者。这种复杂性的增加带来了管理和整合来自多个患者、多个时间点、多个地点和多个感兴趣群体的结果的挑战。


在规划如此“大型”研究时,开始研究前要考虑的最重要的方面之一是分析将生成的数据量以及如何管理这些数据。为了在这种类型的研究中获得有意义的结果,确保所用方法的严谨性和可重复性是关键,这不仅要求您有获取结果的技术,还要求您在实验期间遵循操作程序。


事实上,高效存储、备份和组织数据的能力与实际结果同样重要。例如,长期跟踪患者意味着您需要比较几个月甚至几年后的样本情况。为了成功完成一项研究,不遗漏重要发现或丢失数据,您需要有条不紊地组织起来,并能够整合有关单个样本的所有信息。制定良好的标准操作流程,了解如何识别、存储和备份数据,对于产生有意义的结果至关重要。大型复杂项目涉及许多个人和时间点,通常由一组科学家进行,每个科学家都有自己的数据组织方式。甚至命名文件也会变得具有挑战性:在一个简单的流式细胞术实验中,每个患者在 4 个不同时间点获得 3 个不同的面板,最终每个患者可能会有 12 个 fcs 文件,您需要能够快速识别(何时获得?哪个患者?哪个检测方案?)。将所有这些信息存储在文件名中可能会变得混乱,当将其乘以这种纵向实验环境中通常存在的患者数量时,障碍就会变得显而易见。


随着新技术能够在单个试管中获取越来越多的参数,最终文件的大小是一个需要考虑的重要因素。到目前为止,我们甚至还没有考虑实验控制、面板控制(例如,荧光减一 - FMO)或由于染色或流速错误或任何其他您可能无法控制的变量而重新运行测试。


图 1:该图显示了在简单研究中可以生成的文件总数以及生成的 fcs 文件的相对大小的示例。 如果在四个最重要的时间点为每个患者收集 3 个管,每个管包含 19 个参数:治疗前和治疗后、干预后和随访。仅患者的 FCS 文件大小就约为 384 MB,其中包含给定的参数。此外还有元数据,例如患者 ID、实验编号或结果/生物标志物。 下载信息图

此外,为了提高效率,您需要找到一个好的解决方案,除了存储所有文件外,还要存储与该实验相关的其他信息,例如染色方案或与这些样本相关的任何其他元数据,以便您能够随时调用实验的每个变量。找到一种将最终结果链接到原始数据的方法将在需要编辑时为您节省大量时间。

在研究中,组织文件至关重要。保持所有生成的文件清晰有序需要所有相关实验室都制定良好的工作说明。首先考虑数据是成功的关键。

  • 数据管理案例

    阅读我们对Jamie D.McNicol的采访,了解他是如何管理纵向研究的。

    了解更多

    Jamie D. McNicol

  • Cytobank Premium

    Cloud-based platform that offers machine-learning assisted analysis of high dimensional single cell data.

    了解更多 免费试用

    Cytobank Premium

  • Cytobank Enterprise

    Enterprise licenses provide access to a private cloud and are designed to meet the needs of larger research teams in institutions or biopharma R&D or clinical research organizations.

    立即使用

    Cytobank Enterprise

  • Machine Learning Quiz

    Test how much you know about machine learning and learn how you can apply it to your research.

    了解更多

    Machine Learning Quiz


联系我们获取更多咨询