连接组学是通过分析和绘制神经连接来研究大脑功能的科学领域。它有助于更好地了解人体神经系统的复杂结构。在本文中,您将了解 Google AI 和马克斯普朗克神经科学研究所的研究人员如何使用新型循环神经网络,将连接组数据处理的准确性提高一个数量级。
为了理解生物神经网络的工作原理,有必要以纳米级的分辨率对脑组织进行 3D 可视化。这通常使用电子显微镜来完成。然后分析所得图像以追踪神经突并识别单个突触连接。
图像的分辨率非常高,这就是为什么一立方毫米的脑组织可以占据超过1000TB!因此,大脑图谱的主要问题不在于获取连接组学数据,而在于自动化其解释。
3D 图像分割
在电子显微镜图像中追踪神经突是图像分割的一个例子。自动执行此过程的现代算法将任务分为两个阶段。首先,使用分类器或边缘检测器搜索神经突之间的边界。为此,使用体素强度信息。然后使用分水岭或图形切割方法将未由边界分隔的体素分组为不同的片段。
2015 年,Google AI 开始尝试结合这两个步骤的替代方法。他们向输入分类器添加了另一个带有预测对象图的通道,从而创建了循环模型。
该算法分析图像的一部分
并使用卷积神经网络迭代地填充各个区域。网络预测哪些体素是最初检测到的片段的一部分。自 2015 年以来,研究人员做了大量工作,将这种方法应用于连接组学数据集,并彻底评估其准确性。该实施称为“洪水填充网络”(FFN)。
以 2D 形式分割对象的洪水填充神经网络的示例。黄点是当前焦点区域的中心。该算法迭代地探索图像并扩展分割区域(蓝色)。
洪水填充网络和分段
FFN 有两个输入通道:一个用于 3D 图像,另一个用于预测对象图 (POM) 的当前状态。 POM 使用从 0 到 1 的实数值范围,并对体素是否属于被分割对象的估计进行编码。在每次迭代中,神经网络当前视野中所有体素的 POM 数据都会更新,然后发送回输入。
在分割新对象之前,网络的视野以原始元素为中心。它的 POM 值设置为 0.95,所有其他体素的 POM 值设置为 0.05。权重转移到 1 和 0 以避免过度拟合。
此外,行业电子邮件列表有助于实施具有成本效益的 行业电邮清单 营销策略。传统广告媒体通常需要大量资金,并且可能无法产生成比例的回报。相比之下,通过结构良好的列表进行电子邮件营销可让组织以极低的成本与潜在客户互动。这种可访问性使即使是小型企业也能有效竞争并扩大其市场范围,而无需承担过多的费用。
每次迭代后,使用随机梯度下降和所有体素的交叉熵(逻辑)损失来调整权重。通过各段的移动顺序是随机的。
神经网络架构
FFN 基于 19 层 3D-CNN(三维卷积神经网络),具有无增强层 (SAME) – 这意味着每层的输入和输出大小相同。所有层都使用 ReLU 激活函数、3x3x3 内核和大小为 32 的特征图(最后一层除外)。最后一层执行体素卷积,组合来自所有特征图的输入数据(内核大小 1x1x1)。
洪水填充神经网络的体系结构。
分割
一般的分割过程包括三个步骤:
对齐:在此阶段,通过互相关相邻三维部分来处理原始图像。这有助于发现结构中的不规则和变化。研究人员通过使用弹性对齐算法提高了该过程的准确性。
细胞分割:使用 FNN 分割图像中与细胞内 使用思维导图构建您的信息 部相对应的部分。体素由组织类型分类器预先标记。
细胞簇分割: FNN 的视野仅限于标记为细胞斑块的体素。由于处理它们的过程是在各个片段上迭代执行的,因此神经网络可能会错过细胞连接并产生间隙。为了避免这种情况,在整个源数据量中进行额外的分段和合并。
测量精度
谷歌人工智能与马克斯·普朗克认知科学和神经科学研究所的科学家一起开发了一种新的准确度指标,称为预期游程长度(ERL)。它的名字来源于研究人员想要回答的问题:“在犯错误之前,你能从 3D 图像中的任意给定点追踪一个神经元多远?”
该指标是平均故障间隔时间的一个特殊示例,但在这种情况下,测量的是错误之间的间隔长度,而不是时间。 ERL 将跟踪路径与算法产生的单个错误的频率联系起来。这对研究人员来说很重要,因为特定的 ERL 数字可以指示具有生物学意义的数量,例如神经系统不同部分的神经元的平均路径长度。
— 即使在重大失败和批评之后也不要放弃。约翰·迈克菲 (John McAfee) 有机会让他的产品成为防病毒产品中的“iPhone”,但他离开了公司并放弃了战斗。
现在轮到小编提问了:
您想在博客上看到更多关于著名IT商人和创业者的信息吗?写在评论中——了解读者的意见对我们来说很重要。
您可以使用此网络演示来可视化训练真正的卷积神经网络的过程。查看图层过滤器的外观以及它们生成的激活图。如果您等待一段时间,您会注意到训练图上的损失有所减少。页面的最底部是神经网络对测试样本的预测。
为了巩固之前所有讲座中获得的知识,我们 美国手机号码列表 为您准备了一份作业。尝试实现最近邻分类器、支持向量机、softmax 分类器和简单的两层神经网络。你不必做以上所有的事情:你可以只承担你感兴趣或不完全理解的事情。点击链接查找所有必要的文件和说明。
要完成作业,
您将需要 Python > 3.6 和 Jupyter Notebook 或 Jupyter Lab 环境。
在下一讲中,我们将更详细地了解训练现代神经网络的过程并讨论可能出现的问题。如果有些事情不清楚,请提出问题。您想在单独的文章中详细了解哪些主题吗?我们在评论中等待您的建议!以下讲座列表将在材料可用时更新。