人工智能生成身份的识别方法，单靠眼睛看不够了

www.creaders.net | 2026-06-23 11:35:25 情报分析师 | 0条评论 | 查看/发表评论

你们有没有收到过陌生人的好友请求，看了一眼头像，觉得"这人挺正常的"，然后就通过了？

几乎所有人都举手。

对。这就是问题所在。

问题已经换了一张脸

去年在油管上有一个案例，一名芝加哥男子叫Grant，在Facebook Dating上遇到了一个"女性"。

两个人聊了好几个月，视频通话都有过，对方的声音、表情、笑容，一切看起来都很真实。

最后Grant损失了7万美元——不对，应该说，他把7万美元转进了一个根本不存在的投资平台，而跟他谈了几个月恋爱的那个"人"，是一套运行在服务器上的AI系统。

这不是科幻。这是2025年以后的日常诈骗作业。

以前识别假账号很简单：头像是从某个库存图片网站截的，个人简介两句话，好友列表里全是机器账号，发帖记录要么是空白要么全是转发。

2015年前后，在情报培训课上学的"怎么识别假账号"，讲的就是这套方法，基本上十分钟能搞定一个。

现在这套方法几乎全部失效了。

新一代的AI生成身份长这样：一张清晰自然的人脸照片，在谷歌和百度里反向搜索不到任何结果，因为这张脸根本不存在，是AI凭空生成的；个人简介写得连贯有温度，读起来像是一个真实的人在认真介绍自己；社交记录从两三年前就开始积累，有时间跨度，有情绪变化，有"生活细节"。

一个研究人员做过一个测试：一台五年前的旧电脑，零图像编辑技能，从零开始搭建一个完整的假身份，包括文件、照片、社交历史——总共花了70分钟。

70分钟。

这就是你现在面对的对手。

先从那张脸开始

640 (5).png

任何人拿到一个可疑账号，第一步都应该看头像。不是因为头像最重要，而是因为它最直接，可以最快给出信号。

AI生成的人脸，主要来自两类技术。

一类是GAN（生成对抗网络），典型代表是StyleGAN，thispersondoesnotexist.com用的就是这个，每次刷新就生成一张新的人脸，而这张脸永远不会出现在任何身份证上。

另一类是扩散模型（Diffusion Model），是Midjourney、DALL-E、Stable Diffusion背后的技术。这两类生成的人脸在视觉上非常不同，检测方法也略有差异。

怎么说呢，理论上最好用的视觉判断方法，其实是看眼睛。

人的双眼在真实光照环境下，角膜上会有光点反射，也叫角膜镜面高光。这个反射的形状、角度和位置，在左右两眼上应该是基本一致的，因为两只眼睛看的是同一个空间，接受的是同一个光源。

GAN在生成人脸的时候，它的训练目标是"让这张脸看起来真实"，而不是"遵守物理光学规律"，所以它根本不在乎角膜反射是否对称。结果就是：AI生成的人脸，两眼的高光点形状往往不一致，有时候一个圆润有时候一个扭曲，有时候干脆缺失其中一个。

640 (6).png

布法罗大学的研究团队开发了一套自动化工具，专门通过分析双眼角膜反射的一致性来识别GAN人脸，测试中准确率达到了94%。[buffalo]

640 (7).png

上图这些人哪些是假的？答：全部都是假的。

当然，你在看一张头像的时候，不可能用肉眼去分辨角膜反射。但有几个肉眼可见的特征可以作为初步筛查：

耳环和眼镜

这是GAN的经典盲区。如果一张AI脸戴了耳环，你会发现左耳和右耳的耳环往往形状不一样，甚至一个有一个没有。眼镜也是——AI很难让两片镜片完美对称，经常出现一边倾斜或者形状扭曲的情况。

GAN在训练时重点学习的是人脸，对背景的处理能力相对弱。背景部分经常出现奇怪的扭曲、撕裂感，或者颜色异常渗透到头发边缘——行话叫"荧光渗透"（bleed-through），就是背景的亮色倒进头发里，形成一圈光晕。这在标准摄影里是不会出现的。

牙齿

这是AI的另一个弱点。面带笑容的照片里，牙齿往往渲染异常，形状相近、颜色均一，缺乏真实牙齿的不对称细节，有时还会出现"三颗门牙"这种匪夷所思的情况。

发丝边缘

真实照片里头发的边缘是自然散乱的。AI生成的头发有时看起来过于均匀、过于顺滑，或者在头发与背景的交界处出现一层模糊的发光层，像是剪切蒙版没做干净。

算了，说了这么多视觉特征，其实有一个更实际的做法：直接上工具。

Hive Moderation（thehive.ai）提供免费的图片AI检测，可以直接上传头像，它会给出一个0到1的置信分数，分数越高说明AI生成的可能性越大，测试准确率据称高达99.9%。

FotoForensics（fotoforensics.com）则用的是ELA（错误级别分析）技术，原理是检测图片里不同区域的压缩噪声差异——如果一张图片某些区域的噪声和周围不匹配，通常意味着这个区域被单独处理或合成过。

还有一个更基础的操作：反向图片搜索。

把头像图片上传到Google Images、Yandex Image Search或者TinEye，看看这张脸有没有出现在别的地方。

老式假账号经常用库存照片，会被搜出来。但AI生成的人脸恰恰不会——因为这张脸是独一无二的，之前从未存在过，自然也找不到匹配结果。

注意，"搜不到"不等于"真实"。

这个逻辑要倒过来想：搜到了同一张脸出现在别处，那肯定有问题；搜不到，只能说排除了库存照片这条路，不代表排除了AI生成。

一张脸只是入场券，真正的验证从这里开始

大多数人用反向图搜索没搜到，就觉得"这人应该是真的"。

这个逻辑漏洞可以害死人。

图片核查只是第一关。通过之后，要开始做身份考古。

账号创建时间与内容密度的关系

真实的人在网上积累存在感，是一个自然的、非线性的过程。他们可能某一年发了很多帖子，某一年几乎消失，可能因为换工作、搬家、生了孩子。

AI构建的假身份，如果要制造"历史感"，通常会批量生成内容，时间线看起来均匀——一周发几条，每条间隔差不多，内容风格高度统一，没有"人生起伏"。

打开那个账号，滚到最底部，看最早的帖子是什么时候。如果账号号称已经有六七年历史，那么它六七年前的帖子应该反映出当时的语境——当时的热门话题、当时流行的表情包、当时用的网络流行语。

如果一个声称2018年就开始活跃的账号，它最早期的帖子用的是2024年才流行的网络梗，那就有问题了。

数字足迹的跨平台一致性

真实的人会在多个平台上留下互相印证的记录。一个人的LinkedIn说他2019年在某个公司工作，那他那段时间可能在Instagram晒过办公室咖啡，在Twitter/X上转发过行业新闻，说不定还在某个论坛里回答过相关领域的问题。这些痕迹是自发的、分散的、语境各异的。

假身份很难做到这一点。因为构建这些痕迹需要大量时间和资源，哪怕AI能帮忙生成内容，跨平台痕迹的时间戳一致性依然很难伪造。

具体如何操作

把那个人的用户名拿去跑一遍WhatsMyName（whatsmyname.app），这个工具可以同时在600多个平台上检索这个用户名是否存在。如果结果是零，不能说明什么；如果结果是只有一两个新近注册的账号，而且平台之间没有任何内容互动，值得警惕。

再进一步，把这个人声称工作过的公司用Wayback Machine（web.archive.org）调一下历史快照。

如果那家公司在他声称任职的年份确实存在，而且规模对得上，这是加分项。如果公司官网只有两年历史，或者历史版本里的团队页从没出现过这个人的名字，减分。

这里有一个我的实操步骤：

记录对方声称的关键信息——就职公司、毕业院校、居住城市、工作年限
用Google搜索"公司名 + 人名"，以及"公司名 + site:linkedin.com"
在领英上查那家公司的"员工"列表——如果对方说在那里工作，理论上应该有可查到的痕迹
用Wayback Machine查公司官网的历史页面，看那个人名有没有出现过
如果对方声称有学历，用学校官网的校友搜索或者领英的教育筛选功能核对

以上五步走完，一个真实存在的人至少会留下两三条可以互相印证的痕迹。如果五步全空，这个人从公共记录里彻底蒸发——在数字时代，这本身就是一个很大的异常。

他们怎么写话，和他们说了什么

照片过了，背景信息过了，接下来要看文字。

AI生成的文字，从技术原理上就注定了它有特定的统计指纹。这里面有两个概念值得认真理解：

困惑度

语言模型在阅读一段文本时，会用它的概率系统预测"下一个词应该是什么"。如果实际出现的词跟它预测的高度吻合，困惑度就低；如果实际出现的词很出人意料，困惑度就高。

AI自己写的文字，就是它"预测出来的最可能的词"的连续输出，所以AI文字的困惑度极低——平均分在10到30之间；而人类写的文字，因为我们有私人记忆、个人习惯、情绪冲动，困惑度通常在40到100以上。

爆发度

这是指文本里句子长短的变化幅度。人类写作的节奏是不规律的——可能一段话里有一个三字短句，紧跟着一个五十字的复合句，再来一个反问，再来一个感叹。

AI的输出在句子长度上高度均匀，通常聚集在每句15到25个词，很少出现极短或极长的句子。从外部感受来说，AI写的东西"流畅但没有脉搏"——你读起来很顺，但感觉不到一个活人在跟你说话。

以这两个维度为基础，目前比较可靠的AI文字检测工具是GPTZero（gptzero.me）。在独立基准测试中，GPTZero对纯AI生成文本的检出率达到了95.7%，误判人类文章为AI的比例控制在1%左右。

当然，这个数字是基准测试下的成绩，真实使用中会有更多复杂情况，比如混合写作、风格化写作，准确率会下降到89%到93%之间。

这些工具的结果只是参考，不是判决。

你不需要只靠工具，你也可以直接阅读。AI生成的个人简介有一些非常典型的语言特征，经过对12000个真实与AI生成简介的语料分析，研究者发现AI简介里"adventurous"、"passionate"、"genuine"这类空洞形容词出现的频率是真实简介的4.8倍。这些词听起来像在描述一个人，实际上什么都没说。

另外一个特征叫做"缺乏时间锚点"。

真实的人在描述自己时，会用具体的时间节点，举个简单的例子我三年前搬到这里来，上个月刚换了工作，去年冬天开始学中文。

AI倾向于写永恒的现在时：我喜欢探索新地方，我重视真诚的连接。没有时间，没有具体地点，没有失败和尴尬，只有完美对称的自我描述。

怎么测试？很简单：给对方发一个需要具体细节的问题。

不是"你最近怎么样"，而是"你上次出去玩是去哪里，印象最深的是什么"。

一个真实的人会给你一个稍显随意的、充满个人色彩的回答。

一个AI会给你一个礼貌、全面、结构完整但缺乏任何独特细节的答案——就像一份没有具体案例的工作汇报。

元数据：他们藏不住的时间戳

很多人知道要做图片反向搜索，但很少人会去看图片的元数据（EXIF data）。

EXIF是图片文件里自动嵌入的技术信息，包括：拍摄时间、拍摄设备型号、GPS坐标（如果拍摄时没关掉定位）、图像编辑软件名称。用ExifTool（支持Linux/Windows/Mac的命令行工具，或直接访问exifmeta.com进行在线分析）就可以提取这些信息。

命令行操作如下：

textexiftool -a -u -g1 suspect_image.jpg

重点看以下字段：

Software：如果这里显示的是"Stable Diffusion"、"Midjourney"或者任何AI图像生成器的名字，直接结案。
Create Date vs Modify Date：如果修改时间早于创建时间，说明元数据被人工篡改过。
GPS coordinates：如果对方声称在纽约，但图片GPS显示在东欧某个城市，这个矛盾本身就是一个信号。
Camera Model：真实照片通常来自手机或相机，型号应该是正常的消费设备。如果这里是空的，或者是某个奇怪的软件名，需要追问。

当然，有经验的操作者会提前清除元数据。

这也是一种信号：一个普通用户随手拍的照片，一般不会刻意清除EXIF。

如果你拿到的图片元数据是空的，而且图片看起来又像是专业拍摄的——这个组合本身就要注意了。

行为时间线：他们绕不过去的节奏问题

有一种检查方法，简单到让人觉得不像情报分析，但它非常管用。

去翻那个账号的完整发帖历史，在纸上或者表格里记下每一条帖子的时间戳，然后看节奏。

真实的人有生活节奏。白天上班，可能中午发一条，晚饭后发几条，深夜偶尔冒一条。周末节奏不同，节假日节奏又不同。情绪好的时候发的多，情绪低的时候消失一段时间。这个节奏是有机的、不规律的。

AI账号或者低成本运营的假账号，它的发帖节奏往往呈现出一种机械感：每隔大约相同的时间发一条，不管是凌晨三点还是工作日上午九点，频率高度一致。

或者相反——某一段时间密集爆发（因为某个任务节点），然后突然沉寂（因为换了操作员或者换了任务）。

还有一个细节：账号切换语言或者风格的节点。如果一个账号前两年发帖用的是自然口语，忽然有一段时间切换成了明显的AI语言模式，再后来又恢复成口语，这说明账号可能在某个时间段被AI接管了，然后又回到人工运营。这种"风格断层"在情报调查里是一个非常可靠的信号。

规模背后的产业逻辑

我不想只说技术。技术之外，你需要知道这件事是在一个什么样的规模上发生的。

Interpol在2025年的一份报告里提到，截至2025年3月，已有来自66个国家的受害者被贩卖进东南亚的网络诈骗中心，这些中心雇佣（更准确地说是强迫）工人使用预制的AI生成身份，每天对全球目标发起有组织的接触。

Operation Storm Makers II在2023年涉及27个国家，270,000次检查和执法行动。

2025年以后，这些中心已经大规模引入AI工具，不再需要那么多"人工客服"去维持虚假的情感关系——AI可以同时维持数十条"恋爱关系"，记住每个目标说过的所有细节，无需休息，无需培训。

根据LexisNexis Risk Solutions的调查，如今大约80%的身份欺诈案例里都包含deepfake技术，包括视频覆盖或图像操纵。这意味着即使是视频通话，也不再是验证真人的安全手段。

在亚太地区，2022年到2023年间deepfake相关欺诈事件的增幅超过了1500%。

这个数字重读一遍：1500%。

一套可操作的检查框架

把以上所有内容整合起来是一个分层筛查模型，按照从快到慢、从易到难的顺序排列：

第一层（5分钟以内）：

反向图搜索头像（Google Images + Yandex，因为Yandex对面孔识别能力更强）

把头像上传到Hive Detect或者AI or Not（aiornot.com）做AI生成检测

看账号创建时间，以及最早帖子是否符合当时的时代语境

第二层（15-30分钟）：

WhatsMyName搜索用户名，看跨平台存在情况

用ExifTool或在线工具提取图片元数据

GPTZero分析对方发布过的较长文字，检查AI指纹

翻完整发帖历史，记录时间节奏是否符合真实人类行为

第三层（1小时以上，适合高风险场景）：

用Wayback Machine核查对方声称工作单位或相关网站的历史档案

用LinkedIn验证对方声称的工作经历，看是否有同事背书和相互背书的网络

主动提问，要求对方提供具有强时间锚点的具体细节，并对这些细节独立核查

尝试视频通话，注意观察：帧率是否异常，面部边缘是否有扭曲，光源方向是否与声称的场景逻辑一致

关于视频通话的补充说明：现在的实时deepfake已经能够欺骗普通观察者，那位芝加哥受害者Grant就是在和"对方"进行了多次视频通话后仍然被骗的。你需要关注的不是"脸对不对"，而是一些技术性细节：背景的光源和人脸光源方向是否一致，人脸边缘在快速转头时是否有一帧的模糊或扭曲，耳朵和颈部的轮廓是否自然。

如果条件允许，要求对方完成一些"不可预测的动作"——比如随机举起三根手指或者用手遮住半边脸，这类即兴动作对实时deepfake系统的压力更大，更容易暴露技术痕迹。

这件事为什么比你想的更难

这里要说一个沮丧的事实：即使你把以上每一步都做了，你也无法百分之百确定一个人是真实的。

这不是悲观，这是方法论上的诚实。

检测AI生成身份的本质，是一场一致性核查。你在做的，是收集足够多的信号，看这些信号能不能在独立来源之间互相印证。

如果一个人在十个不同的维度上都呈现出"真实"的特征，而且这些维度之间的逻辑关系是自洽的、难以整体伪造的，那么这个人大概率是真实的。

但"大概率"不是确定。

对抗也在升级。GAN和扩散模型的进化速度，始终比检测工具快一步。今天Hive Moderation能以99.9%的准确率识别某一类AI生成图像，是因为它是基于已知模型的输出训练的。

明天出现一个新模型，它的输出特征还没有进入检测系统的训练集，准确率就会下降。

这是一场没有终点的追逐。

所以最可靠的防御，不是找到一个万能的检测工具，而是建立一种思维习惯：在高风险场景——涉及金钱、涉及机密信息分享、涉及重要决策——任何人的身份都应该经过多维度的独立核查，而不是仅凭直觉或单一技术手段判断。

"那有没有可能整套流程都过了，这人还是假的？"

有。

这就是为什么最后那一关——要求对方提供具有时间特异性的、可独立核查的现实细节是不能省的。

一个真实的人，可以给你提供他上周去的那家餐厅的名字，然后你能在网上找到那家餐厅的用户评价，而且开业时间跟他的描述对得上。

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

更多>>

1	历史即将重演？官媒文章惊人弦外之音
2	梦魇再临？中国突发新冠肺炎公告
3	中南海最怕的真相，正在浮出水面！
4	未来3年可能成白菜价的10样东西别让资产变
5	重磅爆料：习近平正在为大战做准备

48小时新闻排行榜

更多>>

1	历史即将重演？官媒文章惊人弦外之音
2	习近平“亲自指挥” 仅6个月又“烂尾”了
3	“一尊”崩塌传北京官场“讽习”成风
4	梦魇再临？中国突发新冠肺炎公告
5	中南海最怕的真相，正在浮出水面！
6	940份密件曝光！习近平最怕的事藏不住了
7	热评：中国正在撤掉发展的梯子
8	未来3年可能成白菜价的10样东西别让资产变
9	重磅爆料：习近平正在为大战做准备
10	日本4:0大胜！中国球迷集体破防央视峰值

热门专题

1 中美冷战	6 张又侠	11 委内瑞拉
2 美伊战争	7 中共两会	12 四中全会
3 川普	8 俄乌战争	13 何卫东
4 世界杯	9 中日关系	14 AI
5 万维专栏	10 以伊战争	15 大S

一周博客排行

更多>>

1	刘放 \| 美伊协议：一场被严重	万维网友来
2	活着活着68岁了	谢盛友文集
3	“国共内战”的实质：中华民国	万维网友来
4	史诗之怒:神殿没塌,账单挺厚	阿妞不牛
5	京城四大无耻之从郭沫若到冯	席琳
6	加拿大球员断腿！场面过于惨烈	弓长贝占郎
7	田沈生：烛火未灭，警钟长鸣 -	万维网友来
8	美伊谅解备忘录丧权辱国。四大	雷歌747
9	南渡与北归：那些著名的儿子们	席琳
10	近距离看小留：怪物一种	高天阔海

一周博文回复排行榜

更多>>

1	南渡与北归：破灭之后的二次选	席琳
2	世纪之战：大时代过客	菓趣
3	从国共内战到台海困局：大一统	一个人的公
4	美伊谅解备忘录丧权辱国。四大	雷歌747
5	川普已签：美伊谅解备忘录全文	must
6	京城四大无耻之老舍	席琳
7	签的是MOU，不是协议	倩影
8	社会主义，资本主义，马斯克主	山货郎
9	一百年来的中国动物保护	席琳
10	南渡与北归：那些著名的儿子们	席琳


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.