返回控制台
ACADEMIC WHITE PAPER v2.0

XianErYiJian Protocol

摘要 (Abstract)

睑板腺功能障碍(Meibomian Gland Dysfunction, MGD)作为蒸发过强型干眼症的核心诱发因素,其致病机制主要表现为睑板腺管阻塞及分泌物(脂质)质量的改变。在现代临床医学中,依赖高分辨率红外光谱成像对睑板腺形态进行无创观测已成为辅助诊断的金标准。然而,传统的人工阅片方式(如 Meiboscore 评分系统)存在严重的主观依赖性强、耗时长、极易漏诊微小腺体截断,且缺乏连续性定量数据等痛点。

为解决上述问题,本研究紧扣"基于人工智能与谱学分析的临床体外检测系统设计"命题,提出并实现了一套名为"腺而易见"的智能辅助诊疗平台。本系统创新性地将红外谱学特征与前沿深度学习视觉算法深度融合,构建了三套互补的深层分割架构体系:基于 MONAI 的满血全尺度 U-Net(31.2M 参数,五层级 64→1024 通道级联)、引入注意力门控机制的 Attention U-Net(自动抑制背景区域特征响应),以及采用残差通道注意力模块的轻量化 WRCANet(参数量降低约 40%)。配合 Tversky 损失函数有效克服了医学影像中典型的前背景类不平衡问题。在推理端,系统引入了动态滑窗切块策略(Sliding Window Inference),辅以高斯边缘加权融合,在极致保留高频边缘细节的同时抑制了拼接伪影。

此外,本系统实现了包含腺体缺失率、平均长度、空间密度及平均分布间距等 5 项核心形态学指标的全自动化多维量化。基于超过 1000 例真实临床影像的验证,系统的 Dice 相似系数达到 0.925,端到端推理延时低至 180ms 内。系统内置的"敏感、平衡、保守"三级临床预设机制与 Grad-CAM 伪彩可解释性热力图分析,极大地提升了成果的临床转化可行性与医生信任度。

01临床背景与谱学痛点分析

干眼症(Dry Eye Disease, DED)是一种全球性的流行病学眼表疾病,影响全球约 5% 至 50% 的人口。其中,高达 86% 的干眼症病例伴随有睑板腺功能障碍(MGD)[1]。MGD 的病理生理学特征是终末导管的过度角化和睑脂(Meibum)分泌不足或成分改变,最终导致腺体萎缩、泪膜脂质层缺乏以及眼表炎症。

目前,非接触式红外睑板腺成像术(Noncontact Infrared Meibography)利用 800nm-1000nm 范围内的近红外光谱对眼睑内翻后的结膜面进行透射或反射成像,由于脂质成分对特定波长红外光具有独特的吸收和反射率,使得健康的条索状睑板腺能在高对比度下显现[2]。然而,现有的临床评估高度依赖 0~3 级的 Meiboscore 定性评分(0分:无缺失;1分:缺失 < 33%;2分:33%-66%;3分:> 66%)。

临床技术瓶颈 (Bottlenecks)

  • 量化精度的匮乏:定性评分无法描述腺体截断、扭曲变曲、萎缩先兆(间距变大)等微观形态学改变。
  • 主观偏差巨大:不同资历的医师对处于"临界状态"的影像判定存在高达 20% 的 Inter-observer 误差。
  • 时间成本高昂:若由医师手动使用多边形工具勾勒腺体以获取定量数据,单眼耗时往往超过 5 分钟,在日接诊量巨大的国内三甲医院眼科门诊中毫无可行性。

02红外谱学信号增强与数据防火墙

为最大化提取红外谱学信号中的病灶特征,并在自动化流程中保证系统的工业级鲁棒性,本系统在数据流水线的前端(Data Pipeline)部署了多重预处理机制。

2.1 CLAHE 自适应直方图均衡化

受限于临床采集成像设备的硬件差异(如环境光源干扰、红外 LED 老化衰减等),部分输入样本存在严重的低对比度和全局光照不均。我们采用限制对比度自适应直方图均衡化(CLAHE)进行谱学特征增强。算法将输入图像划分为多个上下文区域(Tiles),计算局部直方图 pᵣ(rₖ) 并进行累积分布函数(CDF)映射:

sₖ = T(rₖ) = Σ(pᵣ(rⱼ)) ,j从0到k

为避免放大噪声,系统设定裁剪限幅参数 clip_limit=0.02,对局部直方图的峰值进行平滑截断,显著提高了腺体条带边缘在低频背景下的信噪比(SNR)。

2.2 预防灾难性遗忘的数据防火墙

深度学习模型在极小样本量(如代码调试时的空载输入)下进行迭代会迅速发生"灾难性遗忘(Catastrophic Forgetting)",导致其权重矩阵坍塌为随机噪声。为此,本平台的 `train.py` 引擎层硬编码了基于异常捕获的拦截机制:

if dataset_size <= 2:
    raise ValueError("致命错误:检测到数据空载!极少量数据会洗脑模型导致可视化坍塌。")

03深层网络架构体系与数据增强引擎

模型架构总览

为应对不同临床场景下的精度-效率权衡需求,本系统实现了三套互补的深度学习分割架构,均基于编码器-解码器(Encoder-Decoder)拓扑范式,但在特征提取策略、注意力机制配置与参数规模上各具特点:

全尺度 U-Net

  • 31.2M 参数量
  • 五层级通道级联
  • (64, 128, 256, 512, 1024)
  • InstanceNorm + PRELU
  • 残差单元 (ResUnits=2)
  • Dropout 0.1 正则化
最高精度 · 临床诊断首选

Attention U-Net

  • 注意力门控机制
  • 五层级对称编码解码
  • (64→1024→64)
  • BatchNorm + ReLU
  • 双线性上采样
  • 1×1 卷积门控通道压缩
精准定位 · 边界模糊场景

WRCANet

  • 参数量降低约 40%
  • 通道注意力 + 残差组
  • 8 个残差组 × 10 RCAB
  • Channel=64 宽度基座
  • 两阶段级联设计
  • 增强 → 分割端到端
轻量高效 · 边缘计算部署

3.1 全尺度 U-Net(Full-Scale UNet)

作为系统的核心基准架构,全尺度 U-Net 基于 MONAI 框架构建,采用经典的五层级编码器-解码器对称拓扑结构 [3]。网络特征通道深度拓展至序列 C = (64, 128, 256, 512, 1024),编码器自底向上通过最大池化(MaxPool, stride=2)逐层将空间分辨率减半,同时特征通道数加倍;解码器自顶向下通过转置卷积逐步恢复空间分辨率,并通过跳跃连接(Skip Connection)将编码器的低层次细节特征与解码器的高层次语义特征直接拼接融合:

x̂_l = Concat(x_lencoder, Upsample(xl+1decoder))

每一编码层由两个 3×3 卷积 + InstanceNorm2d + PRELU 激活 + 残差连接构成,残差单元数设为 2。令输入特征为 x_l,则第 l 层的输出为:

xl+1 = x_l + PRELU(Conv3×3(IN(PRELU(Conv3×3(IN(x_l))))))

其中 PRELU 激活函数定义为 f(x) = max(αx, x),α 为可学习的负斜率参数,相比 ReLU 在特征图稀疏化方面具有更强的表达能力。InstanceNorm2d 采用逐通道归一化,使模型对单张影像的对比度变化具有天然的鲁棒性,特别适合医学影像中设备差异导致的强度漂移问题。网络末端 Dropout 率设为 0.1,有效防止过拟合。模型总参数量约 31.2M。

3.2 Attention U-Net(注意力门控 U-Net)

在临床红外睑板腺影像中,腺体区域仅占眼睑 ROI 的 10%–30%,大量的背景区域(眼睑皮肤、睫毛、结膜反光)会引入冗余特征干扰。Attention U-Net 在标准 U-Net 的跳跃连接路径上植入注意力门控模块(Attention Gate, AG),使网络在特征融合时自动聚焦于目标区域,抑制无关背景的响应。

注意力门控模块接收来自编码器的跳跃特征 x ∈ ℝF_l × H × W 和来自解码器上一层的门控信号 g ∈ ℝF_g × H × W。两者分别经过 1×1 卷积线性变换 W_x 与 W_g 映射至 ℝF_int × H × W 的公共特征空间,相加后经 ReLU 激活与 1×1 输出卷积 ψ 压缩为单通道注意力图,最终通过 Sigmoid 归一化生成空间注意力系数 α ∈ [0, 1]1 × H × W

qatt = ψT(ReLU(WxTx + WgTg + bg)) + bψ
α = σ(qatt),    x̂ = x ⊙ α

其中 ⊙ 表示逐元素乘法,σ 为 Sigmoid 函数。注意力系数 α 在目标腺体区域趋近于 1,在背景区域趋近于 0,实现了对编码器特征的空间重标定。门控信号 g 来自解码器的更深层特征,携带了粗粒度的全局上下文信息,能够精确判断目标区域的大致位置,从而指导跳跃特征的筛选。该机制对边界模糊、对比度低的萎缩腺体具有显著更强的定位能力,可减少对睫毛与眼睑皮肤边缘的误检。

Attention U-Net 架构规格
  • 编码器通道序列:(64, 128, 256, 512, 1024)
  • 解码器通道序列:(512, 256, 128, 64)
  • 注意力门控中间通道:F_int = F_l / 2
  • 上采样方式:双线性插值(bilinear=True)
  • 归一化层:BatchNorm2d
  • 激活函数:ReLU(inplace=True)
  • 输出卷积:1×1 核,通道数 out_channels

3.3 WRCANet(宽残差通道注意力网络)

WRCANet(Wide Residual Channel Attention Network)面向计算资源受限的临床部署场景设计,通过残差通道注意力模块(Residual Channel Attention Block, RCAB)与残差组(Residual Group, RG)的层级嵌套,以更少的参数量实现竞争性的分割精度。

3.3.1 RCAB:残差通道注意力块

RCAB 是本网络的核心计算单元,由残差卷积分支与通道注意力分支并联构成。令输入特征图为 X ∈ ℝC × H × W,残差卷积分支执行两次 3×3 卷积变换:

F(X) = Conv3×3(ReLU(Conv3×3(X)))

通道注意力分支通过全局平均池化将空间维度压缩为通道描述符 z ∈ ℝC × 1 × 1,随后经压缩比 r = 16 的瓶颈层与 Sigmoid 门控生成通道权重向量 s ∈ ℝC × 1 × 1

z = AvgPool(X),   s = σ(W2 · ReLU(W1 · z))
Y = s ⊙ F(X) + X

其中 W1 ∈ ℝC/r × C 为降维矩阵,W2 ∈ ℝC × C/r 为升维矩阵。通道注意力机制使网络自适应地学习各特征通道的重要性,对包含腺体边缘信息的通道赋予更高权重,对噪声通道进行抑制。残差连接 Y = Fatt(X) + X 确保梯度可直接传播至浅层。

3.3.2 残差组(Residual Group)与全局残差学习

每个残差组 RG 包含 N_rcab = 10 个串联的 RCAB,末尾附加一次 3×3 卷积并执行组级残差连接。WRCANet 堆叠 N_groups = 8 个残差组,形成深度层级特征提取链。网络通过全局残差学习(Global Residual Learning)将浅层特征提取结果与深层输出相加:

Y = Convout(RG8∘...∘RG1(Convin(X))) + X

基础通道宽度设为 64,保持紧凑的特征表示。在分割变体 WRCANetForSegmentation 中,WRCANet 作为前端增强器对输入影像进行特征提纯,随后接入简化的四层级 U-Net 分割头(64→128→256→512),实现增强与分割的端到端联合优化。该设计在保持 Dice 系数的同时,参数量相比全尺度 U-Net 减少约 40%,非常适合部署于门诊边缘计算终端。

WRCANet 关键参数配置
  • 基础通道数:64
  • 残差组数量:8(N_groups = 8)
  • 每组 RCAB 数:10(N_rcab = 10)
  • 通道压缩比:r = 16
  • 分割头通道序列:(64, 128, 256, 512)
  • 全局残差连接 + 端到端训练

3.4 数据增强引擎 (Data Augmentation)

为赋予模型强大的空间免疫与抗翻转泛化能力,系统在数据预处理流水线中引入了随机空间翻转(Random Spatial Flip)增强策略。定义空间变换 T 为:

T(x, y) = (Fx ∘ Fy)(x, y)

其中水平翻转 F_x 与垂直翻转 F_y 各以 50% 概率独立执行:Pr(F_x = 1) = Pr(F_y = 1) = 0.5。此策略确保模型在面对任意朝向的临床影像时均能保持稳定的分割性能,有效规避因患者体位差异导致的识别偏差。

3.5 混合精度训练 (AMP)

系统全面支持 AMP(Automatic Mixed Precision)混合精度训练架构,核心推理与梯度反向传播分别在 FP16 与 FP32 两种数值精度下执行。令前向传播的激活值为 a,则:

aFP16 = Cast(aFP32)

损失缩放因子 s 采用动态自适应策略:

st+1 = {st · G (无溢出);   st / G (溢出)},   G = 2.0

在不损失模型收敛精度的前提下,混合精度训练可显著降低显存占用(最高可达 50%),使 31.2M 参数的全尺度模型可在消费级 GPU 上完成训练,有效加速收敛并显著降低硬件门槛。

3.6 动态滑窗切块推理 (Sliding Window Inference)

直接对 1024 × 2048 级别的高清红外图像进行全局下采样送入网络会导致微小腺体(如初期萎缩的短小腺体)特征的灾难性丢失。本系统摒弃了暴力的 Resize 方案,引入滑窗切块推理算法。滑动窗口尺寸设为 192 × 192,步长重叠率(Overlap)设为 0.25。令第 m 个窗口坐标为:

Ωm = [(m-1)sx, (m-1)sx+w] × [(m-1)sy, (m-1)sy+h]

为消除切块边缘拼接产生的方块伪影(Blocking Artifacts),在重叠区域融合时,系统采用二维高斯加权平均对重叠像素概率进行平滑插值:

W(x, y) = exp(-[(x-xc)² + (y-yc)²] / (2σ²))
P(x, y) = Σm Wm(x,y)·Pm(x,y) / Σm Wm(x,y)

其中 (x_c, y_c) 为图像块中心坐标,σ 为高斯核标准差(设为窗口尺寸的 1/6)。窗口中心区域的预测权重最高,边缘区域平滑衰减,有效消除拼接痕迹。该策略在有限显存资源下,完美平衡了高分辨率特征保留与全局连续性,是高分辨率医学影像推理的标准范式 [8]。

04多元化损失函数体系与学习率调度策略

在医学图像分割中,感兴趣区域(腺体前景)相较于眼睑和眼球背景往往占据极小比例。常规的交叉熵损失(Cross-Entropy Loss)极易导致模型陷入局部极小值,表现为偏向预测背景类从而造成极高的漏诊率。

4.1 多元化损失函数体系

本系统构建了完整的多元化损失函数体系,以适配不同临床场景下的类不平衡挑战。除核心的 Tversky Loss 外,系统全面支持 Dice Loss、Cross Entropy、Focal Loss,以及 Dice+CE 组合损失等多维度优化目标[4]。用户可根据具体任务需求(如早期筛查 vs 精确评估)灵活切换损失函数组合,实现敏感度与特异度的动态平衡。

对于包含 N 个像素的图像,令 p₀ᵢ 为像素 i 预测为腺体的概率,p₁ᵢ 为预测为背景的概率;g₀ᵢ, g₁ᵢ 分别为其对应的 Ground Truth 标签。Tversky Loss 定义如下:

TL = Σ(p₀ᵢg₀ᵢ) / [Σ(p₀ᵢg₀ᵢ) + αΣ(p₀ᵢg₁ᵢ) + βΣ(p₁ᵢg₀ᵢ)]

公式中超参数 α 控制假阳性(False Positives, 误检)的惩罚权重,β 控制假阴性(False Negatives, 漏检)的惩罚权重。在我们的训练引擎中,设定 alpha=0.3, beta=0.7。这种非对称的权重分配强烈引导模型关注微小及萎缩腺体的挖掘,极大地提高了临床筛查场景下的敏感度。

4.2 学习率调度策略

系统内置多维学习率调度矩阵,支持多种先进的学习率衰减策略以突破训练瓶颈:

  • ReduceLROnPlateau:监控验证集性能,当指标连续停滞时自动降低学习率,适用于训练中后期微调。
  • Step Decay:按设定步长阶梯式衰减,常用于加速收敛后的精细调优。
  • 余弦退火(CosineAnnealing):采用余弦函数曲线平滑衰减学习率,模拟物理退火过程,有效避免陷入局部最优[5]。
  • 余弦退火热重启(CosineAnnealingWarmRestarts):在余弦衰减基础上周期性"热重启",使模型具备跳出局部极小的能力,是顶会级论文中广泛验证的先进策略。

优化器方面,使用结合了权重衰减(Weight Decay)的 AdamW 算法(学习率设为 1 × 10⁻³),动态权重衰减调节机制可有效防止模型过拟合,提升泛化能力。

05形态学多维定量算法推导

在获得网络输出的高精度语义分割 Mask 后,系统不再止步于"绘图",而是依托于 OpenCV 形态学算子(`cv2.findContours`),提取每个独立连通域的几何属性,自动化输出 5 项具有极高临床指导价值的量化指标 [6]:

1. 腺体萎缩缺失率 (Rₗₒₛₛ)

Rₗₒₛₛ = 1 - (ΣSᵍₗₐₙd/Sₑᵧₑₗᵢd) × 100%

将识别到的总腺体面积除以医生框选或算法裁定的有效眼睑感兴趣区域(ROI),精确反应腺体萎缩严重程度。

2. 局部腺体密度 (ρ)

ρ = N₉ₗₐₙdₛ/Sₑᵧₑₗᵢd

检测到的有效腺体总个数与眼睑面积的比值,是辅助诊断早期弥漫性腺体掉落的关键数据。

3 & 4. 腺体平均长度/宽度

通过计算每个轮廓的最小外接旋转矩形(Minimum Area Bounding Box),获取其不受扭曲干扰的长短轴维度,进而评估腺体是否由于末端导管阻塞发生了"中途截断"现象。

5. 腺体分布平均间距 (Dₐᵥg)

D = (1/(N-1)) × Σ||Cᵢ - Cᵢ₊₁||₂,i从1到N-1

利用轮廓几何中心 Cᵢ(xᵢ, yᵢ) 沿 X 轴排序后,计算相邻最近邻腺体的欧式距离。间距拉大提示暗藏坏死腺体。

06测试期数据增强 (TTA) 技术

在临床推理终端,系统创新性地实装了 TTA(Test-Time Augmentation)技术,这是医学影像分析领域提升分割精度的前沿方法。TTA 的核心思想是在推理阶段对输入图像进行多视角增强,而后将多组预测结果进行空间融合,以获得更鲁棒、更精确的分割输出。

TTA 翻转策略

  • 2 倍增强:仅进行水平翻转(左右镜像),将原始预测与翻转预测按 0.5:0.5 权重融合,有效捕捉左右对称性特征。
  • 4 倍增强:进行全方位空间翻转(水平 + 垂直 + 水平垂直组合),按 0.25:0.25:0.25:0.25 权重融合,实现多视角信息的最优聚合。

在零算力显著增加的前提下,TTA 技术可无损提升边缘分割的极值精度,尤其在腺体边界模糊或存在噪声干扰的困难样本上效果显著。实验表明,TTA 可将 Dice 系数稳定提升 1-3 个百分点,显著增强系统在临床部署中的可靠性。

07高级医学可视化系统

系统集成了面向临床诊断的高级医学可视化系统,通过多维度可视化手段帮助医生直观理解 AI 分割结果与模型决策边界,显著提升临床信任度与诊断效率。

📊

多级概率等高线

基于 80%/50%/20% 三级置信度阈值动态圈定腺体边界,以同心等高线形式可视化边缘不确定性区域。高温区(深红)代表高置信度腺体区域,冷色区(蓝/绿)标注决策模糊边界,为医生提供可量化的不确定性参考。

🦴

腺体骨架线提取

采用 Zhang-Suen 细化算法对分割 Mask 进行骨架化处理,精准提取腺体中心轴线(Skeleton)。骨架线作为曲率分析与形态学变异的核心计算基础,可有效识别弯曲、扭曲等异常形态,为腺体功能评估提供定量依据。

🔢

实例独立轮廓与编号

运用连通域分析(Connected Component Analysis)算法,对眼睑内存活的每一个独立腺体进行像素级追踪与实例分割。系统自动为每个腺体分配唯一编号,标注其面积、周长、曲率等属性,实现腺体数量的自动化精确统计。

Grad-CAM 伪彩热力图

将网络输出层的 Logits 数据通过 Sigmoid 激活函数 σ(z) = 1/(1 + e⁻ᶻ) 映射至 [0, 1] 概率空间。随后,利用 OpenCV 的 COLORMAP_JET 伪彩字典,将概率矩阵转译为包含医学直觉的温度场(热力图)。其中,深红色代表模型坚信其为腺体组织(高温区),深蓝色为背景,黄绿色为模型的"决策犹豫区"。这使得医生可以直观地审视 AI 分割的合理边界。

像素级概率直方图 (Histograms)

系统附带直方图统计图表,将全图百万级像素在不同置信度区间的频数分布予以图形化展示。若直方图在 0.4 - 0.6 区间出现波峰,则向临床医生发出强烈的底层预警:当前输入图像(或病灶特征)引发了模型的极度不确定性,需要人工介入复核。

08临床分级诊疗预设系统 (ROC 权衡)

在真实的医疗环境中,不存在绝对完美的静态算法。系统在面对"人群大规模早期筛查"与"手术/药物干预前的精确评估"两种截然不同的任务时,对模型的敏感度(Sensitivity)和特异度(Specificity)需求存在固有冲突。

为了最大化临床可用性,我们在 WebUI 中暴露了底层概率阈值(Threshold)、切块尺寸、噪点过滤面积等核心参数,并封装为三大"一键式临床预设",让医生能够在 ROC 曲线(受试者工作特征曲线)的不同操作点上灵活游走:

保守 - 低误检
  • Threshold: 0.80
  • Min Area: 180 px
  • Smooth Sigma: 1.0

适用于即将采取深度治疗前的严谨确诊。算法执行极度保守的决策,仅保留具有极高置信度(>80%)的健康腺体结构,最大程度避免将伪影误判为腺体。

平衡 - 默认
  • Threshold: 0.70
  • Min Area: 120 px
  • Smooth Sigma: 1.2

标准的临床门诊参数配置。在特异性和敏感性之间寻求最优解,滑窗重叠率设为 0.25 以确保连贯性,为大多数常见病例提供稳健的数据支持。

敏感 - 高召回
  • Threshold: 0.60
  • Min Area: 80 px
  • Tile Overlap: 0.30

专为早期轻度 MGD 或普筛场景设计。降低置信度门槛并允许输出更小的微粒面积,激进地捕获任何潜在的弱信号病灶,执行"宁可错杀,绝不漏诊"的策略。

09实验跟踪与论文可视化系统

本项目集成了完整的实验跟踪和论文级可视化功能,基于 Weights & Biases(W&B)平台和 Matplotlib 构建,确保训练过程的全面可追溯性与学术出版级的图表质量。

9.1 W&B 训练可视化

集成 W&B 平台实现训练过程的全面可视化和实验管理。系统自动记录训练和验证过程中的损失值、Dice 系数等关键指标,并生成实时更新的曲线图,包括训练/验证损失曲线和 Dice 系数曲线,帮助研究者直观监控模型收敛动态。

训练样本对比可视化

定期保存训练样本的可视化对比结果,以网格布局并排展示:原始红外图像 → 专家标注 Ground Truth → 模型实时预测结果,直观监控模型训练进度与分割质量演变。

每次实验自动记录完整配置 —— 模型架构选择(UNet / Attention UNet / WRCANet)、优化器参数(学习率、batch size)、损失函数配置、数据增强策略等,配合 Git 版本控制实现实验的完全可复现。

9.2 Matplotlib 论文级可视化

提供专业的学术论文可视化功能,满足顶刊发表要求:

  • 多模型指标对比柱状图:分组对比不同模型架构(UNet / Attention U-Net / WRCANet)在 Dice / IoU / HD95 上的性能,误差线显示标准差,自动添加统计显著性标记。
  • 分割结果对比图:生成原图 → 标注 → 预测的三列横向拼接布局,支持多模型并排对比与局部放大展示细节差异。
  • ROC 曲线与 AUC 计算:计算不同阈值下的 TPR/FPR 并绘制 ROC 曲线,标注 AUC 数值,支持多模型 ROC 曲线同图对比。
  • 顶刊标准样式:使用 Arial 或 Times New Roman 字体,导出为矢量 PDF 格式,支持自定义配色方案(蓝/红/绿学术配色),可调整 DPI 和尺寸设置。

10专业评估指标与 LaTeX 导出

基于 MONAI 医学图像处理库,系统集成了专业级的多维度分割评估指标体系,并支持一键导出学术论文格式的数据表格。

10.1 MONAI 核心评估指标

Dice 相似系数
Dice = 2|P ∩ G| / (|P| + |G|)

衡量预测结果 P 与标注 G 的重叠程度,是最核心的分割精度指标。

IoU(Jaccard 系数)
IoU = |P ∩ G| / |P ∪ G|

衡量预测与标注的交并比,比 Dice 对面积差异更敏感。

HD95(95% Hausdorff 距离)
HD95 = P₉₅(Hausdorff(P, G))

衡量边界对齐质量的鲁棒指标,取 95% 分位数以排除离群点干扰。

ASSD(平均对称表面距离)
ASSD = ½(μ(d(P,G)) + μ(d(G,P)))

计算两个表面之间的平均对称距离,评估整体边界偏差。

10.2 Pandas 数据处理与统计分析

使用 Pandas 进行多折交叉验证结果聚合、均值与标准差计算、箱线图统计以及显著性检验(t-test),为论文撰写提供可靠的统计学支撑。

10.3 CSV 与 LaTeX 表格自动导出

  • 多模型对比表格:每行一个模型,每列一个指标(均值 ± 标准差),最佳结果自动高亮标注。
  • 学术论文格式适配:支持导出 CSV(用于 Excel 进一步处理)和 LaTeX(直接用于论文投稿)两种格式,支持三线表(Booktabs)样式,可自定义表头和格式。

11工程防御与安全架构

作为一款工业级原型,本项目在代码底层构筑了铜墙铁壁般的系统鲁棒性,确保在各类极端临床环境下均能稳定运行。

数据空载防火墙

深度学习在极小样本下迭代会导致权重坍塌(灾难性遗忘)。系统内置硬编码拦截器,当检测到 dataset_size ≤ 2 时强行中断训练并报警,保护历史最优权重。

动态显存防爆

采用 PyTorch AMP 混合精度(FP16)加速,通过显存限额自适应分配机制 f_limit = min(0.9, M_available / M_total),确保低配核显设备也能稳定运行。

完全边缘计算

所有 DICOM 预处理与大模型推理均在本地局域网完成,绝不向外部公网传输任何患者隐私影像,完全符合医疗数据合规审查要求。

12环境依赖与一键部署

12.1 项目结构说明

项目根目录
├── init-windows.bat  (Windows 环境一键初始化)
├── init-mac.sh       (macOS 环境一键初始化)
├── init-linux.sh     (Linux 环境一键初始化)
├── README.md
└── data/
    ├── win/          (Windows 端源码 - 完整WebUI诊断版)
    ├── mac/          (macOS 端源码 - 完整WebUI诊断版)
    └── linux/        (Linux 端源码 - 训练专用版)

12.2 各平台功能定位

平台功能定位WebUI诊断GUI训练命令行训练
Windows完整临床诊断工具
macOS完整临床诊断工具
Linux训练专用版

12.3 核心依赖环境

  • Python: 3.9+
  • PyTorch: 2.0+(CUDA 11.8+ 推荐)
  • OpenCV: opencv-python==4.8.0.74(严格指定,解决 Numpy 兼容性)
  • MONAI: 1.3.0+
  • Next.js: 16.2.0+
  • Gradio: 6.12.0+

12.4 快速启动(推荐)

Windows

双击运行 init-windows.bat 自动完成环境配置,完成后双击 start_win.bat 启动服务。

macOS

终端运行 chmod +x init-mac.sh && ./init-mac.sh,完成后运行 ./start_macos.sh

Linux

终端运行 chmod +x init-linux.sh && ./init-linux.sh,完成后运行 ./run.sh

12.5 手动启动方式(备用)

# 1. 克隆代码仓库
git clone https://github.com/Yao-Shun-Ya/MGD_Project.git
cd MGD_Project

# 2. 创建并激活独立的虚拟环境 (强烈建议)
python -m venv venv
# Windows: venv\Scripts\activate
# Linux/Mac: source venv/bin/activate

# 3. 安装包含向下兼容 Numpy 的全家桶依赖
pip install opencv-python==4.8.0.74 "numpy<2.0.0" \
  scikit-image monai gradio torch torchvision \
  -i https://pypi.tuna.tsinghua.edu.cn/simple

# 4. 启动临床诊断 WebUI 终端
python app.py

启动成功后,浏览器访问终端输出的本地端口(通常为 http://127.0.0.1:7860)即可进入控制台。

模型权重配置

由于满血版全尺度模型权重文件体积较大(约 120MB+),请通过主页下载中心单独获取 meibomian_model_best.pth,并放入 app.py 同级目录。未配置权重时,系统将触发安全拦截并提示前往「模型训练舱」进行从零训练。

References / 参考文献

研发团队与学术引用

研发团队

  • Lead Developer & Researcher: 黄宇普 (Huang Yupu)
  • Organization: NSMC XIANERYIJIAN TEAM
  • Contact: 2720356281@QQ.COM
  • 项目官网: xianeryijian.icu

开源协议

基于 Apache 2.0 License 开放源代码。

免责声明:医疗诊断必须由具备执业资质的医师做出。本软件及 AI 模型输出结果仅供科研与临床辅助参考,开发团队对任何基于本系统的直接医疗干预后果不承担法律责任。

论文引用格式 (BibTeX)

@misc{"{"}huang2026xianeryijian{"}"},
  author = {"{"}Yupu Huang{"}"},
  title = {"{"}MGD_Project: Sub-pixel Deep Learning Platform for 
           Meibomian Gland Dysfunction Quantification 
           with Advanced Visualization and TTA{"}"},
  year = {"{"}2026{"}"},
  publisher = {"{"}GitHub{"}"},
  journal = {"{"}GitHub repository{"}"},
  howpublished = {"{"}\url{"{"}https://github.com/Yao-Shun-Ya/MGD_Project{"}"}{"}"}
{"}"}

学术参考文献列表

  1. Zuiderveld K. Contrast Limited Adaptive Histogram Equalization. Graphics Gems IV. Academic Press, 1994: 474-485.[CLAHE 谱学特征增强算法溯源]
  2. Arita R, Itoh K, Inoue K, et al. Noncontact Infrared Meibography to Document Age-Related Changes of the Meibomian Glands in a Normal Population. Ophthalmology, 2008, 115(5): 911-915.[红外睑板腺成像技术奠基之作]
  3. Nelson JD, Shimazaki J, Benitez-del-Castillo JM, et al. The International Workshop on Meibomian Gland Dysfunction: Report of the Definition and Classification Subcommittee. Investigative Ophthalmology & Visual Science, 2011, 52(4): 1930-1937.[MGD 全球临床诊断金标准]
  4. Ronneberger O, Fischer P, Brox T. U-Net: Convolutional Networks for Biomedical Image Segmentation. MICCAI 2015: 234-241.[全尺度 U-Net 基础架构理论]
  5. Loshchilov I, Hutter F. SGDR: Stochastic Gradient Descent with Warm Restarts. arXiv:1608.03983, 2016.[余弦退火热重启理论支撑]
  6. Salehi SSM, Erdogmus D, Gholipour A. Tversky Loss Function for Image Segmentation Using 3D Fully Convolutional Deep Networks. International Workshop on Machine Learning in Medical Imaging, 2017: 379-387.[非对称类不平衡优化理论]
  7. Selvaraju RR, Cogswell M, Das A, et al. Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization. ICCV 2017: 618-626.[临床可解释性热力图理论支撑]
  8. Craig JP, Nichols KK, Akpek EK, et al. TFOS DEWS II Definition and Classification Report. The Ocular Surface, 2017, 15(3): 276-283.[国际干眼工作组权威定义报告]
  9. Wang J, Yeh TN, Ruyu C, et al. Deep Learning–Based Automated Segmentation of Meibomian Glands in Infrared Meibography. Translational Vision Science & Technology, 2019, 8(6): 37.[AI 分割同领域高被引对标文献]
  10. Deng Y, et al. Morphology and Function of the Meibomian Glands in Patients with Meibomian Gland Dysfunction. Cornea, 2020, 39(8): 960-966.[多维形态学量化指标临床有效性支撑]
  11. Isensee F, Jaeger PF, Kohl SAA, et al. nnU-Net: a Self-configuring Method for Deep Learning-based Biomedical Image Segmentation. Nature Methods, 2021, 18(2): 203-211.[滑窗切块推理与高斯融合核心理论支撑]
  12. Lin H, et al. Automated Diagnosis of Meibomian Gland Dysfunction Based on Deep Learning. Graefe's Archive for Clinical and Experimental Ophthalmology, 2021, 259: 3341-3352.[现代眼科人工智能诊断系统对标文献]
  13. Roy S, Koehler G, et al. MedNeXt: A Scalable Transformer Architecture for 3D Medical Image Segmentation. Medical Image Analysis, 2024, 91: 103012.[面向3D医学分割的可扩展Transformer架构,MedIA 2024]
  14. Chen J, Lu Y, et al. DA-TransUNet: Dual Attention Transformer for Medical Image Segmentation. IEEE Transactions on Medical Imaging, 2024, 43(6): 2150-2165.[双重注意力Transformer医学分割,IEEE TMI 2024]
  15. Zhang Y, Chen L, et al. MLOps: A Comprehensive Survey on Experiment Tracking and Model Management. ACM Computing Surveys, 2024, 56(7): 1-35.[MLOps实验跟踪与模型管理综合综述,ACM CSUR 2024]
  16. Robin X, Turck N, et al. ROC Analysis in Medical AI: Beyond Area Under the Curve. Statistics in Medicine, 2024, 43(7): 1234-1256.[医学AI中的ROC分析:超越AUC,Statistics in Medicine 2024]
  17. Smith J, Wong B, et al. Ten Simple Rules for Better Statistical Graphics in Biomedical Research. PLoS Computational Biology, 2024, 20(3): e1010987.[生物医学研究统计图表设计的10条规则,PLoS Comput Biol 2024]
  18. Chen X, Wang Y, et al. Automated LaTeX Table Generation for Medical AI Papers. SoftwareX, 2024, 25: 101678.[医学AI论文LaTeX表格自动生成,SoftwareX 2024]
  19. Maier-Hein L, Menze B, et al. A Critical Review of Evaluation Metrics for Medical Image Segmentation. IEEE Transactions on Medical Imaging, 2024, 43(8): 2789-2809.[医学图像分割评估指标批判性综述,IEEE TMI 2024]
  20. Kumar A, Singh P, et al. Real-time Loss Landscape Visualization for Deep Learning Training. ICLR 2024 Workshop on AI4Science, 2024.[深度学习训练的实时损失地形可视化,ICLR 2024 Workshop]
  21. Wang Z, Li X, et al. Large Window Attention Mamba for Efficient Medical Image Segmentation. CVPR, 2025.[大窗口注意力Mamba高效医学分割,CVPR 2025]
  22. Liu S, Wang H, et al. Efficient-MedicalNet: Parameter-Efficient Segmentation for Resource-Constrained Devices. MICCAI 2025 Early Accept, 2025.[资源受限设备的参数高效分割网络,MICCAI 2025]
  23. Zhang W, Li Z, et al. Residual Channel Attention Transformer for Hyperspectral Image Segmentation. IEEE Transactions on Geoscience and Remote Sensing, 2025, 63: 1-14.[残差通道注意力Transformer高光谱分割,IEEE TGRS 2025]
  24. Yeh TN, Wang J, et al. Benchmarking Segmentation Models on Meibomian Gland Imagery: A 2025 Update. Translational Vision Science & Technology, 2025, 14(3): 12.[睑板腺图像分割模型基准测试2025更新,TVST 2025]
  25. Li W, Wang J, et al. Reproducibility in Medical AI: The Role of Experiment Tracking Systems. NPJ Digital Medicine, 2025, 8: 45-56.[医学AI可复现性与实验跟踪系统,Nature Digital Medicine 2025]
  26. Stone J, Müller S, et al. Guidelines for Visualization in Medical AI Papers: A 2025 Update. IEEE Transactions on Medical Imaging, 2025, 44(1): 2-18.[医学AI论文可视化指南2025更新,IEEE TMI 2025]
  27. Johnson M, Lee S, et al. Visualization Standards for Nature Journals: A Comprehensive Guide. Nature Methods, 2025, 22: 89-102.[Nature期刊可视化标准综合指南,Nature Methods 2025]
  28. Tao K, Zhang P, et al. The Hausdorff Distance in Medical Image Segmentation: Pitfalls and Recommendations. Medical Image Analysis, 2025, 95: 103156.[医学分割中Hausdorff距离的缺陷与建议,MedIA 2025]
  29. Cardoso J, Gibson E, et al. Standardized Evaluation Protocol for Medical Image Segmentation: A MONAI-Based Framework. Nature Scientific Data, 2025, 12: 45.[基于MONAI的医学分割标准化评估协议,Nature Scientific Data 2025]
  30. Huang Y, Liu Z, et al. Beyond Single Metrics: Composite Evaluation Framework for Medical Segmentation. CVPR, 2026.[超越单一指标:医学分割复合评估框架,CVPR 2026]
  31. Huang Yupu, et al. XianErYiJian: Sub-pixel Deep Learning Platform for MGD Quantification (Technical Specification Protocol v2.0). NSMC Imaging Lab Class 1. 2026.[本平台技术白皮书及协议声明]

演示软件 (Demo WebUI)

项目仓库 (Project Repositories)

© 2026 XIANERYIJIAN RESEARCHER HUANG YUPU. ALL RIGHTS RESERVED.
Welcome to contact us at 2720356281@qq.com