你有没有想过,当用户戴着VR头显打游戏、开会、做手术模拟的时候,系统如何确认"这个人真的是他"?密码?PIN码?
虹膜识别,本是身份认证皇冠上的明珠——但它的阿喀琉斯之踵,在于必须正面凝视摄像头。戴着头显,用户压根不会去看那个偏角摄像头。
2025年10月,复旦大学联合四所高校发布了ImmerIris——迄今规模最大的公开虹膜数据集,同时提出了一个颠覆性的"无归一化范式"。这不只是一篇学术论文,它在重新定义这个赛道的规则。
01/传统虹膜识别的极限在哪里?
过去30年,虹膜识别的"标准操作"是这样的:用户站在专用设备前,正视摄像头,让设备完成清晰的正轴图像采集。系统随后完成两步走:
传统两阶段范式:
①归一化(Normalization):将环形虹膜区域"展平"成矩形纹理条带
②特征提取:对矩形纹理做编码,生成身份模板(IrisCode)
这套范式在机场、边境、金融窗口这些"配合型场景"中运行良好。但它有一个致命假设:用户必须正对摄像头,图像是轴对称的。
VR头显打破了这个假设。摄像头固定在头盔侧面,拍到的虹膜是偏轴的——椭圆变形、纹理不均匀拉伸,归一化流程直接失效。
02/ImmerIris:打破数据壁垒
长期以来,虹膜识别研究的"粮草"短缺——数据集要么是私有的,要么规模太小。偏轴+无约束场景的数据,更是几乎空白。
ImmerIris用VR头显采集,直接填补这个空白:

数据集涵盖了三类核心挑战:
透视畸变:偏轴拍摄导致虹膜呈椭圆形,局部纹理不均匀拉伸
类内差异:同一只眼,因光照角度、注视方向变化而外观差异显著
质量退化:眼睛半闭、快速眨眼等非配合状态导致遮挡和模糊
4种递增难度协议,从"理想条件"到"完全非配合",给不同能力的算法提供了公平的擂台。
03/无归一化范式:简单即强大
这篇论文最令人眼前一亮的,不是数据集本身,而是它提出的解决方案——出人意料地简单。
范式对比
传统范式
圆形虹膜检测→归一化展平→特征提取→匹配
无归一化范式
Bounding Box裁剪→端到端深度学习(ViT骨干)→直接匹配
核心思路是:与其修复失败的归一化,不如彻底绕开它。
方法极简:用一个可靠的边界框定位虹膜区域,保留虹膜纹理和周围的上下文信息(眼睑、睫毛等眶周线索),然后送入基于ViT的骨干网络直接端到端学习身份特征。
关键结果
在ImmerIris 4个递增难度协议上,无归一化方法全面超越所有SOTA归一化方法
在传统基准(CASIA-Iris-V4)上同样达到一流水准,验证了通用性
图片
04/工程师视角:这对我们意味着什么?
如果你正在做虹膜识别相关的工程工作,这篇论文有几个直接的技术启示:
1
归一化不是必须品,是历史包袱
Daugman的IrisCode设计于1990年代,归一化假设完全轴对称采集。如果你的部署场景不满足这个假设,大胆考虑端到端方案。
2
ViT是虹膜特征提取的新基线
Vision Transformer的全局注意力机制,天然适合处理形变和遮挡。眶周上下文(睫毛、眼睑)被自然纳入,相当于额外的生物特征融合,无需额外设计。
3
近50万张图片告诉你:数据比算法更值钱
ImmerIris规模是此前公开数据集的数十倍。工程实践中,在自己的目标场景下收集足够多的偏轴、低质量图片,往往比调参更有效。
4
XR是下一个量产窗口
Apple Vision Pro、Meta Quest 3已经在量产。VR/AR头显的普及意味着一个巨大的无感式虹膜认证市场,用户不需要"配合"——认证在自然使用中完成。
05/行业雷达:格局正在改变
ImmerIris不是一个孤立的学术贡献,它折射出虹膜识别行业的几个深层趋势:
趋势一:从"配合式"到"无感式"
边境口岸已有3米以上的远距离虹膜识别落地(HOMSH Phaselirs™系列)。XR场景是另一个"无感"维度——用户根本感知不到认证在发生。
趋势二:开放数据集正在重塑竞争格局
ImmerIris是公开的。这意味着初创公司、学术团队可以在同一基准上竞争。算法护城河的高度,正在下降——工程实施能力和场景专有数据,才是真正的壁垒。
趋势三:端侧推理压力增大
VR头显是算力受限设备,ViT模型轻量化部署是绕不开的工程课题。HOMSH乾芯系列FPGA/ASIC芯片,恰好对标这个场景——端侧低功耗虹膜特征提取。
趋势四:生物特征融合成为标配
无归一化方法天然融合了虹膜+眶周信息,相当于虹膜+局部人脸的软融合。多模态生物特征识别(虹膜+人脸+声纹)是下一代边缘身份认证系统的方向。
···
HOMSH观察
ImmerIris验证了我们在OVAI系统开发中的判断:下一代虹膜识别算法,必须从源头上兼容非理想采集条件,而非依赖后处理补救。
虹识技术Phaselirs™算法已在中距离(3m)、低配合场景验证,乾芯芯片提供端侧加速。XR虹膜认证的硬件+算法完整栈,我们在跟进。
📄论文信息
标题:ImmerIris:A Large-Scale Dataset and Benchmark for Off-Axis and Unconstrained Iris Recognition in Immersive Applications
机构:复旦大学、淮阴师范学院、郑州轻工业大学、同济大学
arXiv:2510.10113(2025年11月更新)
数据集:499,791张眼部图像/564受试者/4种评测协议(拟公开)
关注公众号:国声
上一篇:博鳌观察:让AI更好服务人类健康
下一篇:没有了