杠杆股票杠杆港币杠杆 Open Ephys电生理数据采集软件P

正规靠谱的股票配资平台_最专业股票配资平台-杠杆股票杠杆港币杠杆 Open Ephys电生理数据采集软件P

你的位置：正规靠谱的股票配资平台_最专业股票配资平台 > 最专业股票配资平台 > 杠杆股票杠杆港币杠杆 Open Ephys电生理数据采集软件P

发布日期：2025-03-16 23:07 点击次数：67

小脑浦肯野细胞（P-细胞）的电生理数据的分析提出了独特的挑战尖峰分选。复杂的尖峰具有从一个事件到下一个事件显著变化的波形，从而引起错误识别的问题。即使复杂的尖峰信号被正确地检测到，简单的尖峰信号也可能属于不同的P细胞，从而增加了错误归因的危险。为了解决这些识别和归因问题，我们编写了一个开源的半自动化软件P-sort，然后通过分析记录在三个物种中的P细胞数据来测试它：绒猴，猕猴和小鼠。像其他排序软件一样，P-sort依赖于非线性降维来聚类尖峰。但是杠杆股票杠杆港币杠杆，它也使用简单和复杂尖峰之间的统计关系来合并不同的集群和拆分单个集群。与专家手动策展相比，偶尔P排序识别出更复杂的尖峰，并防止聚类的错误归因。三个现有的自动分拣机表现不太好，特别是在识别复杂的尖峰。为了改进小脑分析工具的开发，我们提供了313个记录会话的标记数据，以及三个物种的P-细胞的波形和放电模式的统计特征。

执行尖峰排序的算法依赖于波形来聚类尖峰。然而，小脑浦肯野细胞产生两种类型的尖峰;简单和复杂的尖峰。复杂尖峰与产生简单尖峰的抑制一致。在这里，我们记录了来自三个物种的神经生理数据，并开发了一种名为P-sort的尖峰分析软件，该软件依赖于这种统计特性来改善小脑中简单和复杂尖峰的检测和归因。

展开剩余97%

东莞富临医疗科技有限公司是Open Ephys 和 Intan Technologies 在亚洲的代理商，富临医疗为亚洲客户提供“技术服务”与“电生理产品”

一、引言

记录小脑的神经元活动既带来了机遇，也带来了挑战。小脑的主要细胞——浦肯野细胞（P-cells）——可以通过其独特的电生理特性进行识别。在小脑的细胞中，只有P-cells会产生简单和复杂 spikes。这使得我们可以使用统计方法来识别P-cells：复杂 spike 的生成应该伴随着简单 spikes 的暂停。然而，复杂 spikes 的检测非常困难，因为这些 spikes 不仅罕见，而且其波形在P-cell体细胞25微米范围内会发生显著变化。在P-cell的树突区域，复杂 spike 是一个缓慢的负波形，但随着电极接近体细胞，缓慢的波形变为正波形，并发展出一个尖锐的初始负 spike，随后是数量不等的 spikelets，这些 spikelets 会改变波形。因此，通常我们会检测到简单 spikes 但未检测到复杂 spikes，或者检测到复杂 spikes 但后来发现它们并未伴随简单 spikes 的抑制，因此这些 spikes 不属于同一个P-cell。为了解决这些问题，我们开发了一款 spike 分析软件，帮助检测简单和复杂 spikes，并量化这两种事件是否由单个P-cell生成。

与简单 spikes 不同，复杂 spikes 的功率主要集中在低频范围（30–800 Hz）。因此，典型的复杂 spike 在数据的低通滤波表示（局部场电位；LFP）中会产生一个“宽 spike”。事实上，复杂 spike 检测的两个最新进展是依赖于LFP波形的新型算法。一旦简单和复杂 spikes 被标记，最后一步是确定复杂 spike 后简单 spikes 是否被抑制。如果是这样，那么可以得出结论，这两种 spikes 是由单个P-cell生成的。然而，在某些数据集中，复杂 spikes 没有LFP特征。此外，即使复杂 spikes 被检测到，部分或全部简单 spikes 可能属于不同的P-cell，甚至是非P-cell。

因此，问题有两个方面：在识别步骤中，我们需要标记简单和复杂 spikes；在归属步骤中，我们需要确定哪组复杂 spikes 是由生成特定简单 spikes 簇的P-cell生成的。为了应对这些挑战，我们组建了一个包括研究狨猴、猕猴和小鼠的实验室的合作团队。我们的软件是使用三个物种中记录的300多个P-cells数据库开发的。

物种和记录电极的多样性帮助我们识别了小脑电生理学中的一些关键问题。来自各个实验室的专家提供了多样化的意见，帮助我们验证算法并突出其局限性。在此，我们报告了这一努力的成果。

P-sort 是一款开源的、基于 Python 的软件，可在 Windows、MacOS 和 Linux 平台上运行。为了聚类波形并识别简单和复杂 spikes，P-sort 使用了线性降维算法和最近开发的非线性算法 UMAP。重要的是，它量化了复杂和简单 spikes 之间的概率相互作用，提供了一个客观的度量标准，可以拆分单个簇或合并两个不同的簇，尽管它们的波形相似或不同。因此，P-sort 帮助用户超越波形，改进 spikes 的标记。

然而，P-sort 的一个局限性是它需要用户交互。为了鼓励小脑自动算法的发展，并允许其他人对相同的数据集进行排序并与 P-sort 的结果进行比较，我们在此提供了来自所有三个物种的标记 spikes 的大型数据库。

二、方法

2.1 实验对象

神经生理学数据来自两只狨猴（Callithrix Jacchus，雄性和雌性，350–370 g，实验对象 M 和 R，4 岁）、六只恒河猴（Macaca mulatta；雄性；5.0–7.4 kg，实验对象 B、F、K、P、S 和 W）和十只小鼠（Mus musculus；雄性 C57BL/6J 小鼠，至少 12 周龄，实验对象 N082、N083、N086、N089、T029、T052、T083、T101、T122 和 T124）。

狨猴出生并饲养在约翰霍普金斯大学医学院自1996年以来由 Prof Xiaoqin Wang 维护的群体中。狨猴的实验程序由约翰霍普金斯大学动物护理和使用委员会评估并批准，符合美国国立卫生研究院的指南。

猕猴的实验程序按照《实验室动物护理和使用指南》（2010年）进行，并超过了实验室动物资源研究所和国际实验室动物评估和认证协会推荐的最低要求。实验程序由华盛顿大学当地动物护理和使用委员会批准。

小鼠的实验程序由贝勒医学院机构动物护理和使用委员会根据美国国立卫生研究院的指南批准。实验小鼠在反向光/暗周期（8:00 关灯至 20:00 开灯）下单独饲养。

2.2 狨猴数据采集

在头部植入手术后恢复后，新世界猴被训练为向视觉目标进行眼跳，并以苹果酱和实验室饮食的混合物作为奖励（10）。使用每只动物的 MRI 和 CT 成像数据，我们设计了一个对齐系统，定义了从钻孔到小脑蚓部各个位置的轨迹，包括小叶 VI 和 VII 中的点。我们使用了一个压电式高精度微驱动器（0.5 μm 分辨率）和集成绝对编码器（M3-LA-3.4–15 线性智能平台，New Scale Technologies）来推进电极。

我们使用三种类型的电极记录小脑：石英绝缘的4纤维（四极）或7纤维（七极）金属芯（铂/钨 95/05）电极（Thomas Recording），以及64触点高密度硅探针（Cambridge Neurotech）。我们将每个电极连接到32或64通道头段放大器和数字化仪（Intan Technologies），然后将头段连接到通信系统（RHD2000，Intan Technologies）。数据以30 kHz采样，并进行带通滤波（2.5–7.6 kHz）。我们计算了一个共同平均参考信号（所有同时记录的通道的中位数，以30 kHz计算），并从所有通道中减去该信号。我们使用 OpenEphys（11），一个开源细胞外电生理数据采集软件，与 RHD2000 系统接口并记录信号。

2.3 猕猴数据采集

数据是在之前的研究中收集的。手术后恢复后，猴子被训练为向视觉目标进行眼跳，并以苹果酱作为奖励。一个记录室被植入小脑的中线（耳间轴后14.5 mm，直向下），提供了对眼动蚓部（小叶 VI 和 VII）的访问。单单位活动是用自制的带有铁颗粒涂层的钨电极记录的（1 kHz 时阻抗为 100 kΩ）。神经生理学数据由 Power 1401 数字化仪以50 kHz采样，随后进行带通滤波（30–10 kHz）。数据实时显示在运行数据采集和分析软件 Spike2的计算机监视器上，并保存以供离线分析。

2.4 小鼠数据采集

单单位细胞外记录如先前所述进行（16）。简而言之，在小脑右侧（距前囟后6.5 mm，外侧2.0 mm）打开一个2至3 mm直径的颅骨开窗，以访问小叶 V 和眨眼微区，硬脑膜由一层 Kwik-Sil（WPI）保护。一个定制的3D打印记录室和互锁盖子（NeuroNexus）用牙科丙烯酸固定在颅骨开窗上，以提供额外的保护。恢复5天后，小鼠通过先前植入的头板固定在跑步机上，使用四极（Thomas Recording，AN000968）急性驱动进入小脑皮层，微驱动器安装在立体定位框架上（Narishige MMO-220A 和 SMM-100）。电压信号以24,414 Hz采样率采集，并进行带通滤波（100 Hz 至 10 kHz，AP 通道）和（2 至 300 Hz，LFP 通道），使用集成的 Tucker-Davis Technologies 和 MATLAB 系统。

2.5 P-sort 主窗口

为了使 P-sort 能够在 Windows、MacOS 和 Linux 上运行，代码使用基于 Python 的库编写（19–22）。GUI 使用 PyQt5和 PyQtGraph 编写，以提供快速直观的用户交互。为了促进用户社区进一步开发 P-sort，我们使用了面向对象的编码.

一个过程从加载数据并将其划分为一个或多个时间段（称为槽）开始。槽框架帮助用户考虑潜在的漂移和 spike 质量和形状随时间的变化。在排序一个槽后，参数和 spike 波形模板将被复制到下一个槽，以促进排序，但用户可以进一步在每个槽中独立更改参数。

排序过程从将信号过滤为两个通道开始，动作电位（AP）和局部场电位（LFP）。默认是四阶巴特沃斯滤波器，AP 和 LFP 通道的范围分别为 50–5,000 Hz 和 10–200 Hz。然而，这些参数可以通过 GUI 修改，以更好地适应数据的特定条件。默认假设是简单 spikes 在 AP 通道中产生负峰值，而复杂 spikes 在 LFP 通道中产生正峰值。然而，这个假设可以通过 GUI 更改。一旦检测到各自的峰值，下一个问题是应该使用什么阈值来拒绝或接受一个峰值作为潜在的 spike。P-sort 计算峰值的直方图，并为每个通道拟合一个具有两个基函数的高斯混合模型（GMM）。下界高斯被认为是噪声，上界高斯是感兴趣的信号。GMM 将查询数据点分配给最大化后验概率的多元正态分量，给定数据：

下界高斯被认为是噪声，上界高斯是感兴趣的信号。基于这个假设，两个拟合高斯的交点被用作默认阈值来修剪检测到的峰值。然而，用户可以通过使用交互式图或直接分配它们的值来手动更改简单 spike（SS）和复杂 spike（CS）阈值。

下一个问题是如何将 LFP 通道中的峰值（可能是复杂 spike）与其在 AP 通道中的波形相关联。在典型的记录中，CS 波形由一个初始的尖锐负峰值和一个宽的正凸起组成。LFP 中的峰值是由于宽的正凸起而产生的，但其时间是可变的。因此，使用 LFP 峰值来对齐 CS 波形是不可靠的。P-sort 提供了三种不同的方法来找到复杂 spikes 的起始点：SS 索引、SS 模板和 CS 模板。最初，它使用检测到的尖锐负峰值（SS 索引）来对齐 CS 波形。这提供了一组假定的 CS spike 波形，以计算 CS 模板（波形的平均值）。然而，由于 CS 波形的可变性，并非所有 CS 都表现出初始的尖锐负峰值。为了解决这个问题，在形成 CS 模板后，用户可以重新检测 CS 并使用 CS 模板来对齐它们，这不会受到初始尖锐峰值缺失的影响。

对于模板对齐，P-sort 使用 LFP 峰值时间点作为起始点。然而，如前所述，这个时间点在每个 spike 之间是可变的。为了考虑 LPF 峰值时间点的可变性，P-sort 将 CS 模板信号（持续时间为 3.5 ms）沿着 LFP 峰值周围的 5 ms 时间窗口（LFP 峰值前 4 ms 和后 1 ms）在 AP 信号上移动，并选择使两个信号之间的相关性最大的时间点。两个信号之间的相关性计算为：

P-sort 确保候选 spike 被标记为简单 spike 或复杂 spike，但不能同时标记为两者。此外，由于 spiking 神经元的绝对不应期，两个任意的 spikes 不能在彼此接近 0.5 ms 的时间内发生。基于这些约束，P-sort 解决了 CS-CS、CS-SS 和 SS-SS 候选事件之间的潜在冲突。每个场景的默认值可以使用首选项界面更改。

在解决潜在冲突后，P-sort 提供了一组潜在的简单和复杂 spikes。对于每组 spikes，P-sort 表示 spike 波形、瞬时放电率分布、峰值分布、条件概率和特征散点图。可以使用多种特征对这些数据进行聚类，包括 UMAP、主成分、spikes 的时间、相对于下一个或前一个 spike 的相对时间、与模板的相似性、峰值值和瞬时放电率。使用交互式图，用户可以根据波形图或特征散点图选择 spikes 的子集，并进一步修剪数据，甚至将它们的标签从简单 spikes 更改为复杂 spikes，反之亦然。随着这些簇的操作，P-sort 提供即时反馈其统计特征，从而允许用户确定简单和复杂 spikes 是否可能由单个 P-cell 生成，以及最新的簇操作是否改善了概率。

总体而言，P-sort 的主窗口旨在提供可视化每个 spike 波形和聚类 spikes 并可视化它们之间相互作用的能力。从这个主窗口，P-sort 分支到两个附加窗口：“聚类模块”和“解剖模块”。

2.6 聚类模块

聚类模块使用户能够使用各种算法形成 spike 波形组，为每个波形簇（或簇的一部分）分配标签，并立即评估标记组之间的统计相互作用。聚类模块包括手动和自动标记工具，以根据其特征或波形标记数据集。这是 P-sort 的关键功能，它允许用户超越 spike 波形，依靠 spikes 之间的统计相互作用来合并看似不同的簇，或将单个簇拆分为两个。

P-sort 依赖于各种算法，如 UMAP、主成分分析等，从 spike 波形中提取特征并降低其维度。UMAP 使用流形学习方法进行降维。该算法分两步执行降维。首先，基于高维空间中样本的局部距离形成加权邻居图。权重表示两个样本在高维空间中连接的概率。然后，优化步骤找到数据的低维布局，最小化两种表示之间的交叉熵。有关 UMAP 算法的完整描述，请参见参考文献 9。

UMAP 优化的一个重要方面是在保留全局结构或形成局部簇之间的权衡。相比之下，主成分分析保留了所有样本之间的成对距离。UMAP 使用两个超参数来调整上述权衡，最近邻居数（n_neighbors）和最小距离（min_dist）。在形成高维图的第一步中，n_neighbors 用于根据每个数据点的第 n 个最近邻居确定局部距离。因此，较小的 n_neighbors 值导致数据的更局部视图和全局结构的丢失。另一方面，min_dist 确定低维空间中点的密度。此超参数影响簇的密度，较高的值导致更密集的表示，较低的值导致更分散的点。我们使用了默认值 min_dist = 0.1 和 n_neighbors = 15 用于我们的应用。有关 UMAP 算法与其他降维技术的比较的更多信息，

一旦计算出这些特征，P-sort 提供了各种算法来自动聚类和标记 spikes。标记的 spike 组之间的统计相互作用是帮助用户确认简单和复杂 spikes 的身份，并确定两者是否属于单个 P-cell 的关键信息。

P-sort 使用的聚类算法包括：1）高斯混合模型（GMM），要求用户指定簇的数量及其初始质心；2）Iso-split 算法（23, 24），它是自动的，并基于双峰测试确定簇的数量；3）HDBSCAN（基于层次密度的噪声应用空间聚类）算法（25），它也是自动的，不需要用户输入。我们为 HDBSCAN 的输出实现了一个后处理层，并将簇的数量限制为少于10个。我们通过将具有最少成员的额外簇标记为噪声（标记为 -1）来实现这一点。除了自动聚类算法外，还实现了一种基于局部异常因子密度（21）的异常检测方法，该方法接收分位数阈值作为输入。所有这些算法默认使用特征散点图的选定元素；然而，用户可以通过从 GUI 中的特征列表中选择多个特征来执行多维聚类。

要使用聚类模块，用户将从特征散点图或波形图中选择感兴趣的 spikes，并为选择分配标签。聚类模块提供了四个交互式子面板，用于表示 1）颜色编码的 spikes 特征散点图，2）每个标签的 spike 波形，3）每个标签的峰值直方图，包括放电率信息，4）所选标签的交叉和自相关图。一旦用户标记了一组假定的简单 spikes，模块提供了概率 Pr(S(t)|S(0))，从而允许用户可视化所选 spikes 的绝对不应期。当用户标记一组假定的复杂 spikes 时，模块提供了概率 Pr(S(t)|C(0))，从而允许用户可视化抑制期。然后，用户可以通过检查相关图来解决潜在简单 spikes 与候选复杂 spike 的归属问题。

小脑神经生理学中的一个独特挑战是找到属于单个 P-cell 的简单和复杂 spike 簇。在某些记录中，一个或多个神经元可能会贡献由单个触点记录的信号。例如，大振幅的简单 spikes 可能不是由产生复杂 spikes 的 P-cell 产生的。相反，较小振幅的简单 spikes 应该与复杂 spikes 配对。

2.7 解剖模块

P-sort 解剖模块旨在提供更多工具来审查单个 spikes。在某些情况下，查看单个 spikes 及其周围事件比平均特征提供了更好的洞察力。解剖模块提供了一组工具，可以在 spike 事件之间移动并随时间查看每个事件。该模块还提供了手动覆盖 spike 或更改其对齐的工具。

2.8 与专家策展的比较

50个会话（34个在猕猴中，16个在小鼠中）由不同的专家使用 Spike2和 P-sort 进行排序。对于 Spike2 排序的数据，我们确保给定的 spike 不会被同时标记为 CS 和 SS，并删除了重叠的标签。接下来，我们通过找到在彼此的 0.5/5.0 ms 窗口内发生的共享复杂/简单 spikes 来比较 P-sort 数据与 Spike2 数据。我们使用时间窗口来考虑由于缺乏模板匹配而导致的 Spike2 数据对齐的可变性。如果给定的 spike 在两个数据集中不共享，则将其标记为独占 spike。为了比较数据集之间的独占 spikes 数量，我们将独占 spikes 的数量归一化为每个数据集中的总 spikes 数量。

2.9 与自动排序器的比较

我们量化了各种自动排序算法在三个不同小脑数据上的性能，范围从简单到中等再到困难。困难的数据集被命名为“P-sort 挑战”。每个数据集包括大约15分钟的狨猴眼动蚓部记录，并包含小脑神经生理学中存在的一些困难，包括来自邻近细胞的不同 spike 模式。因此，数据的排序需要隔离不同的 spike 类型，以及解决 CS-SS 归属问题。使用相同的 0.5/5.0 ms 窗口来检测自动排序器和 P-sort 数据之间的共享和独占 spikes。

对于自动排序器，我们要求一些算法的作者对数据进行排序。P. Yger 使用 SpyKING CIRCUS对数据进行排序，A. Markanday 使用神经网络对数据进行排序。此外，我们使用 Mountainsort4和 KiloSort2对相同的数据进行排序。我们通过基于速率和交叉相关图合并和关联简单 spikes、复杂 spikes 和多单位活动（MUA）来后处理输出，以得出最佳匹配。对于 Mountainsort4，我们使用默认参数，然后手动合并输出单元并标记为 SS1、SS2、CS1、CS2 和 MUA。同样，对于 Kilosort2，我们使用默认参数，并使用 Phy2-interface 相关图和速率手动合并和标记输出。

我们通过计算 spike “一致性分数”（28）来量化每个算法的性能。该分数测量了算法对之间达成一致的 spikes 百分比。这涉及计算匹配的 spikes 数量（使用 1 ms 时间窗口），除以每个排序器报告的 spikes 总数，减去匹配数。使用相同的分数，我们通过让五位专家对自动算法排序的相同数据集进行排序来量化 P-sort 的可重复性。

三、结果

为了说明我们在小脑神经生理学中面临的各种挑战，请考虑图 1 中显示的数据。在这里，LFP 通道（10–200 Hz）以红色绘制，AP 通道（50–5000 Hz）以黑色绘制。有时，我们很幸运能够隔离一个表现出易于识别的复杂和简单 spikes 的 P-cell（图 1A）。在此示例中，LFP 显示了复杂 spike 的大正峰值。为了确认复杂和简单 spikes 源自同一细胞，我们计算了条件概率 Pr(S(t)|C(0)) 和 Pr(S(t)|S(0))，在 ±50 ms 的域内。术语 Pr(S(t)|C(0)) 表示在时间 t 发生简单 spike 的概率，前提是在时间零生成了复杂 spike。术语 Pr(S(t)|S(0)) 是在时间 t 发生简单 spike 的概率，前提是在时间零生成了另一个简单 spike。源自单个细胞的 spikes 会产生一个绝对不应期。因此，Pr(S(t)|S(0)) 在时间零附近表现出接近零的概率期。另一方面，复杂 spike 之后是简单 spikes 的暂停。因此，Pr(S(t)|C(0)) 是不对称的，在时间零点之后有一个长的接近零的简单 spike 概率期。复杂 spike 后简单 spike 抑制的存在，如图 1A（右）所示，证实了这两组 spikes 是由同一个 P-cell 生成的。

图1.小脑锋电位分类的挑战实例。在左列中，局部场电位（LFP）通道（10-200 Hz）以红色绘制，AP通道（50- 5，000 Hz）以黑色绘制。中间列显示了在时间t处简单尖峰（SS）的条件概率，假定在时间零处发生复杂尖峰（CS），标记为Pr（S（t））。|C（0））。注意复杂尖峰之后的不对称抑制。条件概率Pr（S（t））|S（0））指示在时间t处的简单尖峰的概率，假定另一个简单尖峰在时间零处发生。右列包括单独的复合尖峰迹线以及平均迹线。答：在此记录中，复合尖峰具有正LFP峰值。B：在这里，复杂尖峰不能从它们的LFP波形中识别，因为它们缺乏LFP特征。C：在此记录中，复合尖峰具有负LFP峰值。D：在这里，复合棘波与一组简单棘波（SS1）的抑制相一致，但不是第二组（SS2）。概率模式（右列）表明SS2可能不是P细胞。艾凡：在这段录音中，复杂的尖峰脉冲与简单尖峰脉冲的抑制并不一致。因此，两组尖峰不是由相同的P细胞生成的。概率图的区间大小为1 ms。

图 1B 展示了一个更具挑战性的示例。在这里，复杂 spikes 没有 LFP 特征。然而，使用 UMAP（9）对 AP 通道的分析识别了潜在的复杂 spikes。识别的事件是真正的复杂 spikes，如它们的 spikelets 所示（更多示例来自同一细胞，如图 2A 所示），以及复杂 spike 后简单 spikes 暂停的事实（图 1B，右）。

图2.识别复杂尖峰（CS）的额外挑战。答：复杂的锋电位波形因小穗的时间和数量而异。B：复杂尖峰波形由于简单尖峰（SS）的时间接近而变化。这里，在复杂尖峰开始之前的简单尖峰使复杂尖峰波形失真。顶部和中间行：简单尖峰发生在复杂尖峰之前的3或0.2 ms。底行：红色迹线是具有变形波形的复杂尖峰。

如果电极靠近体细胞，复杂 spike 波形可能会表现出类似于简单 spikes 的 spikelets。例如，图 1B 中的复杂 spike 表现出大的 spikelets。这些 spikelets 很难与普通的简单 spikes 区分开来，正如 Pr(S(t)|C(0)) 在 0 到 +10 ms 期间显示出小的非零概率（右，图 1B）所证明的那样，在此期间我们预计会有接近完全的抑制。

复杂 spike 波形多样性的另一个示例如图 1C 所示。在这种情况下，复杂 spike 表现出负的 LFP 峰值，这可能表明电极位于 P-cell 的树突区域。然而，一旦正确识别了复杂 spikes，简单 spikes 就会显示出抑制期。

尽管复杂 spikes 的检测可能具有挑战性，但更关键的问题是归属：有时显著的简单和复杂 spikes 组是由不同的 P-cells 生成的。此问题的一个示例如图 1D 所示。在这里，LFP 信号很容易检测到复杂 spikes。然而，有两组简单 spikes，SS1 和 SS2。标记为 SS2 的 spikes 是较大振幅的事件。值得注意的是，复杂 spikes 不会抑制 SS2 spikes。相反，较小振幅的事件 SS1 是与复杂 spikes 配对的适当简单 spikes。

归属问题的另一种形式如图 1E 所示。在这种情况下，简单 spikes 很容易识别，复杂 spikes 具有负的 LFP。值得注意的是，尽管隔离良好，复杂 spikes 后简单 spikes 并未被抑制。相反，此记录中的两组 spikes 是由两个不同的 P-cells 生成的。

复杂 spikes 的识别还存在其他问题。复杂 spike 波形中的 spikelets 数量是可变的，因此模板匹配可能难以标记所有复杂 spikes。spikelets 可变的示例如图 2A 所示。矛盾的是，当电极靠近 P-cell 的体细胞时，信号强度很高，但 spikelets 引起的波形变化也很大。

最后，复杂 spike 波形可能会因为简单 spike 的接近而失真，如图 2B 所示。这是因为简单和复杂 spikes 是由 P-cell 的不同输入驱动的。简单 spikes 是自发产生的，也是由于颗粒细胞的兴奋性输入。另一方面，复杂 spikes 是由于攀爬纤维的输入而产生的。因此，简单 spike 可以在复杂 spike 之前几分之一毫秒生成（中间图，图 2B）。在这里，紧随简单 spike 的复杂 spike 缺乏启动更典型复杂 spikes 的尖锐成分。因此，复杂 spike 波形因简单 spike 的接近而失真（下图，图 2B）。

总之，复杂 spikes 的识别很困难，因为它们可能缺乏 LFP 特征，它们的波形可能因为附近的简单 spikes 而失真，或者它们的波形可能包含可变数量的 spikelets。在识别简单和复杂 spikes 后，仍然面临找到与生成复杂 spikes 的 P-cell 属于同一细胞的简单 spike 簇的问题。我们编写了开源工具 P-sort 来帮助解决这些识别和归属问题。

3.1 聚类波形

复杂 spike 波形的多样性表明，可能很难找到一种可以推广到所有情况的数学技术。例如，在某些情况下，可以从 LFP 通道识别复杂 spikes（图 1A），而在其他情况下，有必要搜索 AP 通道（图 1B）。在存在两种类型的简单 spikes 的情况下，通常较大振幅的简单 spikes 在复杂 spikes 后被抑制（图 1C），但偶尔较小振幅的 spikes 是正确的选择（图 1D）。P-sort 提供了聚类和假设检验的工具。这些工具包括传统的降维方法，如主成分分析（PCA），以及新颖的算法，如 UMAP。随着用户识别假定的简单和复杂 spikes 组，软件提供了关于 spikes 是否可能来自同一 P-cell 的统计反馈，以及最新的簇操作是否改善了概率。

P-sort 最适合使用原始宽带记录，例如由 Open Ephys 生成的数据，这是一个开源的数据采集软件。然而，P-sort 也可以导入 LFP 和 AP 通道分别采集的数据。加载数据后，用户会获得一个 GUI 来指定如何将数据分块为“槽”。每个槽是一个依次分析的数据区域，但一旦分析了一个槽，其他后续槽会继承诸如 spike 模板和阈值等特征。在宽带数据的情况下，用户可以指定 LFP 和 AP 通道的滤波器属性（图 3A，第1部分）。P-sort 自动选择每个通道的阈值（图 3，第2部分，见方法）并显示结果简单和复杂 spikes 的统计信息（图 3，第3和第4部分）。

图3.P-sort的主窗口。1：动作电位（AP）和局部场电位（LFP）通道的滤波器特性规范。2：阈值选择和在LFP和AP通道中检测到的事件的电压峰值分布。3：简单棘波（SS）的识别。该窗口包括与峰值电压对齐的尖峰波形、瞬时放电频率分布、条件概率Pr（S（t））、条件概率Pr（S（t））和条件概率Pr（S（t））。|S（0）），并使用UMAP进行聚类。4：识别复合尖峰（CS）。窗口包括与学习模板对齐的尖峰波形（黄色）、瞬时放电频率分布、条件概率Pr（S（t））|C（0））证明了简单尖峰的抑制，以及使用UMAP的聚类。红色的轨迹表示复杂的尖峰信号，这些尖峰信号由于附近的简单尖峰信号而被扭曲。一致流形逼近与投影算法

图 3 展示了 P-sort 的主窗口。第1部分：指定动作电位（AP）和局部场电位（LFP）通道的滤波器属性。第2部分：阈值选择以及 LFP 和 AP 通道中检测到的事件的电压峰值分布。第3部分：识别简单 spikes（SS）。窗口包括对齐到峰值电压的 spike 波形、瞬时放电频率分布、条件概率 Pr(S(t)|S(0)) 显示抑制期，以及使用 UMAP 进行聚类。第4部分：识别复杂 spikes（CS）。窗口包括对齐到学习模板（黄色）的 spike 波形、瞬时放电频率分布、条件概率 Pr(S(t)|C(0)) 显示简单 spikes 的抑制，以及使用 UMAP 进行聚类。红色迹线表示因附近简单 spikes 而失真的复杂 spikes。UMAP，Uniform Manifold Approximation and Projection 算法。

在图 3 的示例中，P-sort 自动选择了 LFP 和 AP 通道的阈值，并识别了假定的简单和复杂 spikes。UMAP 空间指示了一个简单的 spike 簇（图 3，第3部分），这由 Pr(S(t)|S(0)) 证实，说明简单 spikes 在零附近有大约 10 ms 的抑制期。然而，UMAP 空间对于复杂 spikes 并不均匀（图 3，第4部分），这意味着波形存在可变性。尽管如此，Pr(S(t)|C(0)) 表现出抑制期。因此，统计上确认简单 spikes 被良好隔离，并在复杂 spikes 后被抑制。

当然，在大多数情况下，数据并不像图 3 所示的案例那样容易排序。另一种常见的情况是复杂 spikes 没有 LFP 特征（图 4A），因此必须搜索 AP 通道。在图 4C 所示的记录中，简单和复杂 spike 波形恰好非常相似。因此，在 PCA 空间中，数据呈现出一个单一的簇（图 4B，左子图）。因此，如果我们仅依赖 PCA，我们可能会得出结论，只有简单 spikes 存在。

图 4 展示了 UMAP 分离简单和复杂 spikes（SS 和 CS，分别）。A：在此记录中，复杂 spikes 没有表现出局部场电位（LFP）特征（红色迹线）。B：在 PCA 空间中聚类 spikes 不会产生清晰的分离。然而，两组 spikes 在 UMAP 空间中分离。UMAP 识别的复杂 spikes 在 PCA 空间中以红色显示。C：UMAP 识别的复杂 spike 和简单 spike 簇的波形和平均迹线。条件概率表明，复杂 spike 事件与简单 spikes 的抑制一致，表明这两组 spikes 可能由同一个 P-cell 生成。误差条为标准差。UMAP，Uniform Manifold Approximation and Projection 算法。

图4.UMAP分离简单和复杂锋电位（分别为SS和CS）。答：在此记录中，复杂尖峰不显示局部场电位（LFP）特征（红色迹线）。B：主成分分析（PCA）空间中尖峰的聚类不产生清楚的分离。然而，这两组尖峰在UMAP空间中分离。由UMAP识别的复杂尖峰在PCA空间中以红色显示。C：由UMAP识别的复杂尖峰和简单尖峰簇的波形和平均迹线。条件概率表明，复杂的尖峰事件与简单尖峰的抑制相一致，这表明两组尖峰可能是由同一个P细胞产生的。误差线是标准偏差。一致流形逼近与投影算法

P-sort 依赖于一种称为 UMAP的降维算法。UMAP 是一种非线性技术，根据我们的经验，它在聚类波形和识别复杂 spikes 方面特别强大，正如研究人员的工作所示。与 PCA 试图保留所有样本之间的成对距离（即全局结构）不同，流形学习算法如 tSNE 和 UMAP 依赖于局部距离。UMAP 首先构建一个高维加权邻居图，然后旨在找到具有相似结构的低维布局。UMAP 空间中的全局和局部结构之间的权衡可以通过 n_neighbors 超参数进行调整，通过基于每个点的第 n 个邻居限制高维图中的局部连接半径（默认值为 n_neighbors = 15）。这导致更好地分离具有局部相似性的不同簇，特别是在不平衡簇大小的情况下。例如，简单和复杂 spike 簇的区分面临不平衡簇大小的问题，因为这两种 spikes 的速率存在内在差异。

实际上，在图 4 的数据案例中，将波形投影到 UMAP 空间揭示了两组簇（图 4B，右子图）。使用图形用户界面（GUI），我们选择较小的 spikes 组并暂时将它们标记为复杂 spikes。立即，P-sort 更新了概率 Pr(S(t)|C(0)) 窗口，如图 4C 所示，说明这些假定的复杂 spikes 后伴随着简单 spikes 的暂停。

3.2 寻找复杂 spikes 的起始点

识别复杂 spikes 的一个问题是波形可能会因为前一个简单 spike 而显著失真。实际上，P-cell 可以在简单 spike 之后几分之一毫秒生成复杂 spike，如图 2B 所示。简单 spike 的接近使复杂 spike 波形失真。如果失真较小，模板匹配可以识别复杂 spikes 的起始点（图 3，第4部分）。然而，正如我们将在下面看到的，模板匹配有时会产生复杂 spikes 的错误对齐。P-sort 可以通过首先使用简单 spike 模板对齐复杂 spikes，然后使用复杂 spike 模板重新对齐来解决这个问题。

图 5A 展示了两步过程的示例。最初，假定的复杂 spikes 由 P-sort 基于简单 spike 模板对齐（见方法）。这种对齐导致两组复杂 spikes（图 5A 中的黑色和红色迹线）。接下来，用户选择正确对齐的复杂 spikes，并根据它们的平均波形定义一个新模板（图 5A，黑色迹线）。最后，用户使用此模板重新对齐所有复杂 spikes（图 5B）。这改善了复杂 spike 的对齐，但对齐失真的复杂 spikes 的问题仍然存在。实际上，UMAP 空间表明存在两组复杂 spikes（图 5B 中的红点和黑点）。然而，由于两组复杂 spikes 都抑制了简单 spikes，它们可能是一个需要合并的单一簇。为了纠正错误，P-sort 提供了解剖模块。解剖模块是一个半手动平台，用于重新标记失真的复杂 spikes 的起始点（图 5C），并正确识别它们之前的简单 spikes。在此重新标记后，复杂 spikes 被正确对齐（图 5D）。

图5.校正复合尖峰（CS）的未对准。答：P-sort最初基于类似于简单尖峰（SS）的钠/钾峰对齐复杂尖峰（见方法）。这导致一些复合尖峰的不对准，因为这些复合尖峰不表达钠/钾峰。用户可以删除未对齐的尖峰（红色）并计算复杂尖峰模板（黄色）。B：尖峰与复杂尖峰模板的对准并不能解决所有复杂尖峰的问题：一些变形的复杂尖峰仍然未对准。C：P-sort提供了一个解剖模块，用户可以通过该模块更改尖峰对齐以补偿变形。D：最终复合尖峰对齐。请注意由简单尖峰（红色迹线）的接近引起的复杂尖峰的变形。

图 5 展示了纠正复杂 spikes（CS）的错误对齐。A：P-sort 最初基于类似于简单 spikes（SS）的钠/钾峰值对齐复杂 spikes（见方法）。这导致一些复杂 spikes 的错误对齐，因为这些复杂 spikes 没有表现出钠/钾峰值。用户可以删除错误对齐的 spikes（红色）并计算复杂 spike 模板（黄色）。B：将 spikes 对齐到复杂 spike 模板并不能解决所有复杂 spikes 的问题：一些失真的复杂 spikes 仍然错误对齐。C：P-sort 提供了一个解剖模块，用户可以通过它更改 spike 对齐以补偿失真。D：最终的复杂 spike 对齐。注意复杂 spikes 因简单 spikes 的接近而失真（红色迹线）。

3.3 识别复杂 spike 的 spikelets

复杂 spike 波形可变性的一个来源是 spikelets 的随机性。根据我们的经验，spikelets 的波形不容易与简单 spikes 区分开来。例如，图 6A 中的复杂 spike 波形表明一个良好隔离的 P-cell，但在复杂 spike 后跟随的简单 spikes 的概率分布 Pr(S(t)|C(0)) 在假定的抑制期内表现出一个尖锐的峰值（图 6C，顶行，红色箭头）。这提出了 spikelets 被错误标记为简单 spikes 的可能性。

图 6 展示了复杂 spike（CS）波形中 spikelets 的识别。A：复杂 spike 波形和潜在 spikelets 的示例。B：为了帮助识别 spikelets 是复杂 spike 波形的一部分还是常规简单 spikes，P-sort 允许用户可视化 spikes 的时间规律性。在此图中，x 轴是每个简单 spike 相对于前一个复杂 spike 的时间，y 轴是该简单 spike 的峰值电压。似乎有两组 spikes。红色箭头指示的簇具有更高的时间精度和较小的峰值电压。C：在识别 spikelets 之前，概率 Pr(S(t)|C(0)) 在复杂 spike 起始后大约 5 ms 处显示一个尖锐的峰值（红色箭头，顶图）。移除这些 spikelets 后，产生了底行的概率。

图6.在复合锋电位（CS）波形中识别小穗。A：复杂尖峰波形和潜在小穗的示例。B：为了帮助识别小尖峰是复杂尖峰波形的一部分还是规则的简单尖峰，P-sort允许用户可视化尖峰的时间规律性。在该图中，x轴是每个简单尖峰相对于紧接在前的复杂尖峰的定时，y轴是该简单尖峰的峰值电压。看上去有两簇尖峰。由红色箭头指示的簇具有较高的时间精度和较小的峰值电压。C：在小穗鉴定之前，概率Pr（S（t）|C（0））显示在复合尖峰开始后约5 ms处的尖峰（红色箭头，顶部子图）。除去这些小穗产生的概率在底部行。

识别一些 spikelets 的启发式方法是它们相对于 CS 起始的时间精度。为了检查这种规律性的存在，P-sort 提供了一个工具，生成一个栅格图，其中简单 spikes 相对于每个复杂 spike 的起始对齐（图 6B）。要生成此图，在主窗口（或聚类模块）的简单 spike 部分，用户选择下拉菜单，选择 t_prev_CS 作为 x 轴，选择 spike 峰值作为 y 轴。这将呈现简单 spikes，其中 x 轴是每个简单 spike 相对于前一个复杂 spike 起始的时间，y 轴是该简单 spike 在其波形峰值处的电压。

如果存在 spikelets，它们的时间可能非常规律，在 CS 起始后 4–10 ms 内产生 spike 对齐的模式（图 6B）。在此示例中，spikelets 可以通过它们的时间规律性和较小的峰值电压与简单 spikes 区分开来。用户可以选择假定的 spikelets 并在主窗口中查看它们的波形。根据我们的经验，波形往往具有较小的振幅但略宽的形状，与常规简单 spikes 相比。然而，主要的启发式方法是 spikelets 在复杂 spike 起始后的强烈时间对齐。

3.4 使用简单和复杂 spikes 之间的统计相互作用合并或拆分簇

小脑神经生理学中的一个独特挑战是找到属于单个 P-cell 的简单和复杂 spike 簇。P-sort 提供了聚类标记和统计工具来帮助解决这个问题。然而，P-sort 的主要优势是超越波形聚类，使用复杂和简单 spikes 之间的统计关系来合并簇，甚至拆分单个簇。

为了说明这一点，让我们从一个特别具有挑战性的示例开始（图 7A）。在这里，波形的视觉检查表明存在多个神经元。实际上，UMAP 聚类产生了多组简单（图 7B）和复杂 spikes（图 7C）。任务是找到信号而非噪声的簇，更重要的是，确定哪些简单 spike 簇可以归属于哪些复杂 spike 簇。

图 7 展示了找到可能由同一个 P-cell 生成的简单（SS）和复杂 spikes（CS）簇。A：此记录包括至少四组 spikes：两组似乎是复杂 spikes，两组是简单 spikes。B：简单 spike 空间的 UMAP 聚类。两个主要簇是 SS1 和 SS2。它们的波形由 D 中的 SS1-1 和 SS2-1 显示。较小的簇是由于这些主要 spikes 以及其他 spikes 的时间接近而失真的 spikes，如 D 所示。较小的 spikes 簇被标记为复杂 spikes 的 spikelets。C：复杂 spike 空间的 UMAP 聚类。两个主要簇是 CS1 和 CS2。它们的波形在 E 中标记为 CS1-1 和 CS2-1。它们的波形可能因简单 spikes 而失真，如 CS1-2 和 CS2-2 所示。D：简单 spike 空间中各种簇的波形。E：复杂 spike 空间中四个簇的波形。F：SS1 和 SS2 的抑制期通过概率 Pr(SS1(t)|SS1(0)) 和 Pr(SS2(t)|SS2(0)) 量化。概率 Pr(SS1(t)|CS1(0)) 量化了 CS1 后的抑制。因此，CS1 与 SS1 的抑制一致，但与 SS2 不一致。CS2 与 SS2 的抑制一致，但与 SS1 不一致。箱线图中的中心标记表示分布的中位数，箱的底部和顶部边缘表示第25和第75百分位数。细线表示数据的范围，不包括异常值。C：P-sort 和专家在放电率方面的差异。右列显示了每个会话中归一化到基线简单 spike 概率的可能性，平均所有记录会话的每个物种（箱大小为 1 ms）。误差条为均值 ± SE。

图7.找到可能由相同P细胞生成的简单（SS）和复杂尖峰（CS）的簇。答：这段录音包括至少四组尖峰：两组看起来是复杂尖峰，两组是简单尖峰。B：简单尖峰空间的UMAP聚类。两个主要的集群是SS 1和SS 2。它们的波形如D中的SS 1 -1和SS 2 -1所示。较小的簇是扭曲的尖峰，这是由于这些主要尖峰以及其他尖峰在时间上接近，如图D所示。小穗的小簇被标记为复杂穗的小穗。C：复尖峰空间的UMAP聚类。两个主要的集群是CS 1和CS2。它们的波形在E.它们的波形可能因简单尖峰而失真，如CS 1 -2和CS2-2所示。D：在简单尖峰空间中标记的各种簇的波形。E：在复合尖峰空间中标记的四个簇的波形。F：SS1和SS2的抑制时间由概率Pr（SS1（t））量化|SS1（0））和Pr（SS2（t））|SS2（0））。概率Pr（SS1（t））|CS1（0））量化CS1之后的抑制。因此，CS1与SS1的抑制一致，而不是SS2。CS2与SS2的抑制一致，但与SS1的抑制不一致。单元大小为1 ms。UMAP，均匀流形近似和投影算法。

简单 spikes 的速率在狨猴（图 12A）中略高于猕猴 [63.8 ± 1.29 Hz vs. 55.9 ± 2.45 Hz，均值 ± SE，独立样本 t 检验，t(285) = 2.75，P = 0.006]。相比之下，狨猴的复杂 spike 速率略低于猕猴 [0.88 ± 0.013 Hz vs. 0.98 ± 0.027 Hz，t(285)= −3.6678，P = 0.0003]。对于简单 spikes，条件概率 Pr(S(t)|S(0)) 在两个灵长类物种中非常相似（图 12C），表明简单 spike 的抑制期相似。

图 12 展示了三个物种中简单和复杂 spikes（SS 和 CS，分别）的统计特性。A：平均放电率的分布。B：简单和复杂 spikes 的波形。每个 P-cell 的简单和复杂 spikes 都通过将简单 spike 波形的负峰值设置为 -1 进行归一化。误差条为标准差。C：简单 spikes 的抑制期（蓝色，SS|SS）和与复杂 spikes 一致的抑制（红色，SS|CS）。SS|SS 表示在时间 t 发生简单 spike 的速率，前提是在时间零发生了另一个简单 spike。SS|CS 表示在时间 t 发生简单 spike 的速率，前提是在时间零发生了复杂 spike。每个 P-cell 的简单和复杂 spike 速率相对于平均简单 spike 放电率进行归一化。误差条为标准差。D：复杂 spike 后简单 spikes 的抑制期。每个 P-cell 的抑制期定义为复杂 spike 后简单 spike 速率恢复到其前复杂 spike 值的63%所需的时间。红线表示均值。E：简单（蓝色）和复杂 spikes（红色）的 interspike 间隔（ISI）分布。每个细胞中每种 spike 类型的 ISI 数据通过将平均 ISI（定义为平均放电率的倒数）设置为1进行归一化。误差条为标准差。

猕猴的复杂 spikes 后伴随着稍长的简单 spike 抑制期（图 12C）。为了测量复杂 spike 后简单 spike 抑制的持续时间，对于每个 P-cell，我们计算了概率 Pr(S(t)|C(0)) 超过复杂 spike 起始前基线63%的时间 T（图 12D）。在狨猴中，P-cells 的平均抑制期为 14.8 ± 0.26 ms，显著低于我们在猕猴中量化的 20.4 ± 0.89 ms 抑制持续时间 [t(285)= −8.0212，P = 3e-14]。

这些差异难以解释，因为 spike 速率和抑制持续时间取决于 P-cell 的精确位置。例如，位于 zebrin 阴性区域的 P-cells 表现出比邻近 zebrin 阳性条纹更高的频率简单 spikes（38）。此外，复杂 spike 后的简单 spike 抑制在 zebrin 阳性区域更长。在狨猴和猕猴中，沿内侧-外侧方向的记录位置几毫米的差异可以改变 zebrin 带特性，特别是在蚓部小叶 VII（39）。因此，物种之间的速率和抑制持续时间的差异可能是由于记录位置的微小差异。

在小鼠数据中，复杂 spike 速率略高于狨猴，1.42 ± 0.07 Hz [t(254)= 12.0275，P = 1e-26]，也略高于猕猴 [t(81)= 7.1277，P = 4e-10]。此外，小鼠的复杂 spikes 后伴随着比猕猴 [t(81) = −5.2055，P = 1e-6] 和狨猴 [t(254) = −2.2462，P = 0.026] 更短的抑制期（12.96 ± 0.80 ms）。

最后，在所有三个物种中，我们观察到 interspike 间隔（ISI）分布的一致模式。为了计算 ISI 分布，我们首先测量了每个 P-cell 中每种 spike 类型的平均 ISI，然后通过将平均 ISI 设置为1对分布进行归一化。结果简单和复杂 spike 的归一化 ISI 彼此不同，但在三个物种中几乎相同（图 12E）。这些模式可能是有用的先验，可以帮助自动软件识别这些 spikes。

四、讨论

小脑中的 spike 排序可以是一种乐趣，类似于寻宝：找到正确的波形簇会产生一个令人满意的统计模式，其中复杂 spikes 后伴随着简单 spikes 的抑制。然而，识别属于 P-cell 的 spikes 对于喜欢手动策展的人和那些使用自动算法的人来说都很困难。虽然大多数复杂 spikes 由于其宽 spike 而留下 LFP 特征（8），但一些复杂 spikes 可能缺乏这一特征（图 1B），可能是由于电极相对于体细胞的位置。此外，复杂 spike 波形可能因简单 spikes 的时间接近、spikelets或邻近神经元的 spikes 侵入而不同。即使在根据波形识别 spikes 后，简单 spikes 可能属于一个 P-cell，而复杂 spikes 可能属于另一个（图 1E）。

为了帮助解决识别和归属问题，我们组织了一组聚类和标记工具，形成一个基于 GUI 的跨平台分析软件，称为 P-sort。与其他排序软件一样，P-sort 根据波形特性聚类 spikes。然而，P-sort 强调了复杂和简单 spikes 之间的统计关系：复杂 spike 后简单 spikes 的抑制。尽管可能存在少数情况下此属性不存在，但通常可以使用此信息来证明合并不同簇的合理性，例如当波形失真时（图 7），或证明拆分单个簇的合理性，例如当来自两个不同细胞的 spikes 具有相似波形时（图 8）。因此，P-sort 为用户提供了超越基于波形的聚类的手段，通过提供关于 spikes 如何相互作用的统计信息。

我们开发 P-sort 得益于来自狨猴、猕猴和小鼠小脑的多样化数据收集。为了验证结果，我们将 P-sort 的结果与小鼠和猕猴实验室专家进行的手动策展进行了比较。此外，我们将 P-sort 与自动算法 MountainSort4、Kilosort2和 SpyKING CIRCUS以及专门训练用于识别复杂 spikes 的神经网络（7）进行了比较。在简单数据集上，这些自动算法的表现通常很好，但在中等和高等难度数据集上，它们偶尔会错过大量复杂 spikes，或将它们错误标记为简单 spikes。将 P-sort 选择的复杂 spikes 与专门训练用于识别复杂 spikes 的神经网络进行比较，产生了近乎一致的结果。

P-sort 遵循传统方法，识别 spike 波形的特征然后进行聚类。它依赖于最近开发的算法 UMAP，这是一种非线性降维技术，根据我们的经验，在聚类波形方面特别强大。UMAP 与另一种称为 t-SNE（t-分布随机邻域嵌入）的非线性降维算法相关。与 t-SNE 不同，UMAP 返回一个可逆变换，可以将新数据投影到其上而无需重新计算映射。这具有独特的优势，允许进行交叉验证，可以用于半监督学习方法，其中专家标记数据子集并让 UMAP 对未标记数据集进行预测。实际上，UMAP 最近被用于聚类小脑的复杂 spikes，并被研究人员用于聚类大脑皮层的 spikes。

然而，UMAP 有一些缺点。在 UMAP 空间中，簇的大小和它们之间的距离不包含有关波形结构的信息。这个问题可以通过在 PCA 空间中查看簇来解决，P-sort 也提供了这一点。此外，UMAP 依赖于随机优化过程，产生不同运行的非确定性结果。为了帮助解决这个问题，P-sort 支持 UMAP 的 GPU 实现，可以在大约1或2秒内提供典型5分钟记录会话的结果。这种快速响应使用户能够多次评估相同的数据集，可能使用不同的波形窗口大小。此外，在大多数情况下，UMAP 可以重现相同数量的簇，并具有相似的拓扑关系。因此，尽管 UMAP 不是确定性的，但它可以提取可重复的簇。无论如何，在噪声记录场景中仍存在过拟合的可能性。为了帮助解决这个问题，聚类模块描绘了每个簇的波形，以及它们与其他 spike 簇的统计关系。

一旦识别出簇，P-sort 提供了自动工具来找到簇边界。改进此步骤的一种方法是使用 Louvain 聚类，即在 UMAP 空间中找到高度互连的 spikes 社区。研究人员最近在皮层 spikes 的排序中展示了这种方法。

然而，找到簇边界并不是排序的唯一方法，正如 SpyKING CIRCUS（26）所示。该工作使用模板定义每个簇的质心，而不是它们的精确边界。在我们的测试中，这种方法在大振幅简单和复杂 spikes 上产生了良好的结果，但在较小振幅 spikes 上表现不佳，如条件概率所示（图 11）。

高密度电极的发展凸显了对自动排序器的需求。这些排序器解决了许多问题，包括不同通道之间的簇匹配，以及多单位排序。此外，它们的软件具有基于 GUI 的可视化和手动策展工具箱，从而允许用户对结果进行后处理。然而，当前的自动方法缺乏用于识别依赖 spikes（即简单和复杂 spikes）的 GUI。相比之下，P-sort 旨在有效地说明和交互处理复杂和简单 spikes 的同时排序和归属。添加多单位排序等功能为自动排序器提供了一个初始起点，随后由 P-sort 进行聚类和归属。

快速发展的硅探针技术使得我们必须鼓励开发小脑的自动排序器。因此，我们使用 P-sort 标记了来自多个物种300多个 P-cells 的记录中的 spikes，并提供此标记数据库以帮助软件开发人员测试和改进他们的算法。

我们希望此数据集的可用性可以通过促进自动算法的发展来帮助小脑社区，这些算法依赖于大型数据集进行训练和验证。此外，由于标记数据反映了 P-sort 的结果，研究人员可以尝试他们当前的排序器并比较结果，从而揭示 P-sort 的潜在局限性。最后，标记数据允许新手 P-sort 用户将他们的排序结果与专家用户进行比较，从而作为教学工具。

东莞富临医疗科技有限公司是Open Ephys 和 Intan Technologies 在亚洲的代理商，为亚洲客户提供“技术服务”与“电生理产品”

公司地址：广东省东莞市樟木头镇塑金国际1号楼810

发布于：广东省

相关资讯

热点资讯

友情链接：