![]() |
|
你们有没有收到过陌生人的好友请求,看了一眼头像,觉得"这人挺正常的",然后就通过了?
几乎所有人都举手。
对。这就是问题所在。
问题已经换了一张脸
去年在油管上有一个案例,一名芝加哥男子叫Grant,在Facebook Dating上遇到了一个"女性"。
两个人聊了好几个月,视频通话都有过,对方的声音、表情、笑容,一切看起来都很真实。
最后Grant损失了7万美元——不对,应该说,他把7万美元转进了一个根本不存在的投资平台,而跟他谈了几个月恋爱的那个"人",是一套运行在服务器上的AI系统。
这不是科幻。这是2025年以后的日常诈骗作业。
以前识别假账号很简单:头像是从某个库存图片网站截的,个人简介两句话,好友列表里全是机器账号,发帖记录要么是空白要么全是转发。
2015年前后,在情报培训课上学的"怎么识别假账号",讲的就是这套方法,基本上十分钟能搞定一个。
现在这套方法几乎全部失效了。
一个研究人员做过一个测试:一台五年前的旧电脑,零图像编辑技能,从零开始搭建一个完整的假身份,包括文件、照片、社交历史——总共花了70分钟。
70分钟。
这就是你现在面对的对手。
先从那张脸开始

任何人拿到一个可疑账号,第一步都应该看头像。不是因为头像最重要,而是因为它最直接,可以最快给出信号。
AI生成的人脸,主要来自两类技术。
一类是GAN(生成对抗网络),典型代表是StyleGAN,thispersondoesnotexist.com用的就是这个,每次刷新就生成一张新的人脸,而这张脸永远不会出现在任何身份证上。
另一类是扩散模型(Diffusion Model),是Midjourney、DALL-E、Stable Diffusion背后的技术。这两类生成的人脸在视觉上非常不同,检测方法也略有差异。
怎么说呢,理论上最好用的视觉判断方法,其实是看眼睛。
人的双眼在真实光照环境下,角膜上会有光点反射,也叫角膜镜面高光。这个反射的形状、角度和位置,在左右两眼上应该是基本一致的,因为两只眼睛看的是同一个空间,接受的是同一个光源。
GAN在生成人脸的时候,它的训练目标是"让这张脸看起来真实",而不是"遵守物理光学规律",所以它根本不在乎角膜反射是否对称。结果就是:AI生成的人脸,两眼的高光点形状往往不一致,有时候一个圆润有时候一个扭曲,有时候干脆缺失其中一个。

布法罗大学的研究团队开发了一套自动化工具,专门通过分析双眼角膜反射的一致性来识别GAN人脸,测试中准确率达到了94%。[buffalo]

上图这些人哪些是假的?答:全部都是假的。
当然,你在看一张头像的时候,不可能用肉眼去分辨角膜反射。但有几个肉眼可见的特征可以作为初步筛查:
耳环和眼镜
这是GAN的经典盲区。如果一张AI脸戴了耳环,你会发现左耳和右耳的耳环往往形状不一样,甚至一个有一个没有。眼镜也是——AI很难让两片镜片完美对称,经常出现一边倾斜或者形状扭曲的情况。
GAN在训练时重点学习的是人脸,对背景的处理能力相对弱。背景部分经常出现奇怪的扭曲、撕裂感,或者颜色异常渗透到头发边缘——行话叫"荧光渗透"(bleed-through),就是背景的亮色倒进头发里,形成一圈光晕。这在标准摄影里是不会出现的。
牙齿
这是AI的另一个弱点。面带笑容的照片里,牙齿往往渲染异常,形状相近、颜色均一,缺乏真实牙齿的不对称细节,有时还会出现"三颗门牙"这种匪夷所思的情况。
发丝边缘
真实照片里头发的边缘是自然散乱的。AI生成的头发有时看起来过于均匀、过于顺滑,或者在头发与背景的交界处出现一层模糊的发光层,像是剪切蒙版没做干净。
算了,说了这么多视觉特征,其实有一个更实际的做法:直接上工具。
Hive Moderation(thehive.ai)提供免费的图片AI检测,可以直接上传头像,它会给出一个0到1的置信分数,分数越高说明AI生成的可能性越大,测试准确率据称高达99.9%。
FotoForensics(fotoforensics.com)则用的是ELA(错误级别分析)技术,原理是检测图片里不同区域的压缩噪声差异——如果一张图片某些区域的噪声和周围不匹配,通常意味着这个区域被单独处理或合成过。
还有一个更基础的操作:反向图片搜索。
把头像图片上传到Google Images、Yandex Image Search或者TinEye,看看这张脸有没有出现在别的地方。
老式假账号经常用库存照片,会被搜出来。但AI生成的人脸恰恰不会——因为这张脸是独一无二的,之前从未存在过,自然也找不到匹配结果。
注意,"搜不到"不等于"真实"。
这个逻辑要倒过来想:搜到了同一张脸出现在别处,那肯定有问题;搜不到,只能说排除了库存照片这条路,不代表排除了AI生成。
一张脸只是入场券,真正的验证从这里开始
大多数人用反向图搜索没搜到,就觉得"这人应该是真的"。
这个逻辑漏洞可以害死人。
图片核查只是第一关。通过之后,要开始做身份考古。
账号创建时间与内容密度的关系
真实的人在网上积累存在感,是一个自然的、非线性的过程。他们可能某一年发了很多帖子,某一年几乎消失,可能因为换工作、搬家、生了孩子。
AI构建的假身份,如果要制造"历史感",通常会批量生成内容,时间线看起来均匀——一周发几条,每条间隔差不多,内容风格高度统一,没有"人生起伏"。
打开那个账号,滚到最底部,看最早的帖子是什么时候。如果账号号称已经有六七年历史,那么它六七年前的帖子应该反映出当时的语境——当时的热门话题、当时流行的表情包、当时用的网络流行语。
如果一个声称2018年就开始活跃的账号,它最早期的帖子用的是2024年才流行的网络梗,那就有问题了。
数字足迹的跨平台一致性
真实的人会在多个平台上留下互相印证的记录。一个人的LinkedIn说他2019年在某个公司工作,那他那段时间可能在Instagram晒过办公室咖啡,在Twitter/X上转发过行业新闻,说不定还在某个论坛里回答过相关领域的问题。这些痕迹是自发的、分散的、语境各异的。
假身份很难做到这一点。因为构建这些痕迹需要大量时间和资源,哪怕AI能帮忙生成内容,跨平台痕迹的时间戳一致性依然很难伪造。
具体如何操作
把那个人的用户名拿去跑一遍WhatsMyName(whatsmyname.app),这个工具可以同时在600多个平台上检索这个用户名是否存在。如果结果是零,不能说明什么;如果结果是只有一两个新近注册的账号,而且平台之间没有任何内容互动,值得警惕。
再进一步,把这个人声称工作过的公司用Wayback Machine(web.archive.org)调一下历史快照。
如果那家公司在他声称任职的年份确实存在,而且规模对得上,这是加分项。如果公司官网只有两年历史,或者历史版本里的团队页从没出现过这个人的名字,减分。
这里有一个我的实操步骤:
记录对方声称的关键信息——就职公司、毕业院校、居住城市、工作年限
用Google搜索"公司名 + 人名",以及"公司名 + site:linkedin.com"
在领英上查那家公司的"员工"列表——如果对方说在那里工作,理论上应该有可查到的痕迹
用Wayback Machine查公司官网的历史页面,看那个人名有没有出现过
如果对方声称有学历,用学校官网的校友搜索或者领英的教育筛选功能核对
以上五步走完,一个真实存在的人至少会留下两三条可以互相印证的痕迹。如果五步全空,这个人从公共记录里彻底蒸发——在数字时代,这本身就是一个很大的异常。
他们怎么写话,和他们说了什么
照片过了,背景信息过了,接下来要看文字。
AI生成的文字,从技术原理上就注定了它有特定的统计指纹。这里面有两个概念值得认真理解:
困惑度
语言模型在阅读一段文本时,会用它的概率系统预测"下一个词应该是什么"。如果实际出现的词跟它预测的高度吻合,困惑度就低;如果实际出现的词很出人意料,困惑度就高。
AI自己写的文字,就是它"预测出来的最可能的词"的连续输出,所以AI文字的困惑度极低——平均分在10到30之间;而人类写的文字,因为我们有私人记忆、个人习惯、情绪冲动,困惑度通常在40到100以上。
爆发度
这是指文本里句子长短的变化幅度。人类写作的节奏是不规律的——可能一段话里有一个三字短句,紧跟着一个五十字的复合句,再来一个反问,再来一个感叹。
AI的输出在句子长度上高度均匀,通常聚集在每句15到25个词,很少出现极短或极长的句子。从外部感受来说,AI写的东西"流畅但没有脉搏"——你读起来很顺,但感觉不到一个活人在跟你说话。
以这两个维度为基础,目前比较可靠的AI文字检测工具是GPTZero(gptzero.me)。在独立基准测试中,GPTZero对纯AI生成文本的检出率达到了95.7%,误判人类文章为AI的比例控制在1%左右。
当然,这个数字是基准测试下的成绩,真实使用中会有更多复杂情况,比如混合写作、风格化写作,准确率会下降到89%到93%之间。
这些工具的结果只是参考,不是判决。
你不需要只靠工具,你也可以直接阅读。AI生成的个人简介有一些非常典型的语言特征,经过对12000个真实与AI生成简介的语料分析,研究者发现AI简介里"adventurous"、"passionate"、"genuine"这类空洞形容词出现的频率是真实简介的4.8倍。这些词听起来像在描述一个人,实际上什么都没说。
另外一个特征叫做"缺乏时间锚点"。
真实的人在描述自己时,会用具体的时间节点,举个简单的例子我三年前搬到这里来,上个月刚换了工作,去年冬天开始学中文。
AI倾向于写永恒的现在时:我喜欢探索新地方,我重视真诚的连接。没有时间,没有具体地点,没有失败和尴尬,只有完美对称的自我描述。
怎么测试?很简单:给对方发一个需要具体细节的问题。
不是"你最近怎么样",而是"你上次出去玩是去哪里,印象最深的是什么"。
一个真实的人会给你一个稍显随意的、充满个人色彩的回答。
一个AI会给你一个礼貌、全面、结构完整但缺乏任何独特细节的答案——就像一份没有具体案例的工作汇报。
元数据:他们藏不住的时间戳
很多人知道要做图片反向搜索,但很少人会去看图片的元数据(EXIF data)。
EXIF是图片文件里自动嵌入的技术信息,包括:拍摄时间、拍摄设备型号、GPS坐标(如果拍摄时没关掉定位)、图像编辑软件名称。用ExifTool(支持Linux/Windows/Mac的命令行工具,或直接访问exifmeta.com进行在线分析)就可以提取这些信息。
命令行操作如下:
textexiftool -a -u -g1 suspect_image.jpg
重点看以下字段:
Software:如果这里显示的是"Stable Diffusion"、"Midjourney"或者任何AI图像生成器的名字,直接结案。
Create Date vs Modify Date:如果修改时间早于创建时间,说明元数据被人工篡改过。
GPS coordinates:如果对方声称在纽约,但图片GPS显示在东欧某个城市,这个矛盾本身就是一个信号。
Camera Model:真实照片通常来自手机或相机,型号应该是正常的消费设备。如果这里是空的,或者是某个奇怪的软件名,需要追问。
当然,有经验的操作者会提前清除元数据。
这也是一种信号:一个普通用户随手拍的照片,一般不会刻意清除EXIF。
如果你拿到的图片元数据是空的,而且图片看起来又像是专业拍摄的——这个组合本身就要注意了。
行为时间线:他们绕不过去的节奏问题
有一种检查方法,简单到让人觉得不像情报分析,但它非常管用。
去翻那个账号的完整发帖历史,在纸上或者表格里记下每一条帖子的时间戳,然后看节奏。
真实的人有生活节奏。白天上班,可能中午发一条,晚饭后发几条,深夜偶尔冒一条。周末节奏不同,节假日节奏又不同。情绪好的时候发的多,情绪低的时候消失一段时间。这个节奏是有机的、不规律的。
AI账号或者低成本运营的假账号,它的发帖节奏往往呈现出一种机械感:每隔大约相同的时间发一条,不管是凌晨三点还是工作日上午九点,频率高度一致。
或者相反——某一段时间密集爆发(因为某个任务节点),然后突然沉寂(因为换了操作员或者换了任务)。
还有一个细节:账号切换语言或者风格的节点。如果一个账号前两年发帖用的是自然口语,忽然有一段时间切换成了明显的AI语言模式,再后来又恢复成口语,这说明账号可能在某个时间段被AI接管了,然后又回到人工运营。这种"风格断层"在情报调查里是一个非常可靠的信号。
规模背后的产业逻辑
我不想只说技术。技术之外,你需要知道这件事是在一个什么样的规模上发生的。
Interpol在2025年的一份报告里提到,截至2025年3月,已有来自66个国家的受害者被贩卖进东南亚的网络诈骗中心,这些中心雇佣(更准确地说是强迫)工人使用预制的AI生成身份,每天对全球目标发起有组织的接触。
Operation Storm Makers II在2023年涉及27个国家,270,000次检查和执法行动。
2025年以后,这些中心已经大规模引入AI工具,不再需要那么多"人工客服"去维持虚假的情感关系——AI可以同时维持数十条"恋爱关系",记住每个目标说过的所有细节,无需休息,无需培训。
根据LexisNexis Risk Solutions的调查,如今大约80%的身份欺诈案例里都包含deepfake技术,包括视频覆盖或图像操纵。这意味着即使是视频通话,也不再是验证真人的安全手段。
在亚太地区,2022年到2023年间deepfake相关欺诈事件的增幅超过了1500%。
这个数字重读一遍:1500%。
一套可操作的检查框架
把以上所有内容整合起来是一个分层筛查模型,按照从快到慢、从易到难的顺序排列:
第一层(5分钟以内):
反向图搜索头像(Google Images + Yandex,因为Yandex对面孔识别能力更强)
把头像上传到Hive Detect或者AI or Not(aiornot.com)做AI生成检测
看账号创建时间,以及最早帖子是否符合当时的时代语境
第二层(15-30分钟):
WhatsMyName搜索用户名,看跨平台存在情况
用ExifTool或在线工具提取图片元数据
GPTZero分析对方发布过的较长文字,检查AI指纹
翻完整发帖历史,记录时间节奏是否符合真实人类行为
第三层(1小时以上,适合高风险场景):
用Wayback Machine核查对方声称工作单位或相关网站的历史档案
用LinkedIn验证对方声称的工作经历,看是否有同事背书和相互背书的网络
主动提问,要求对方提供具有强时间锚点的具体细节,并对这些细节独立核查
尝试视频通话,注意观察:帧率是否异常,面部边缘是否有扭曲,光源方向是否与声称的场景逻辑一致
关于视频通话的补充说明:现在的实时deepfake已经能够欺骗普通观察者,那位芝加哥受害者Grant就是在和"对方"进行了多次视频通话后仍然被骗的。你需要关注的不是"脸对不对",而是一些技术性细节:背景的光源和人脸光源方向是否一致,人脸边缘在快速转头时是否有一帧的模糊或扭曲,耳朵和颈部的轮廓是否自然。
如果条件允许,要求对方完成一些"不可预测的动作"——比如随机举起三根手指或者用手遮住半边脸,这类即兴动作对实时deepfake系统的压力更大,更容易暴露技术痕迹。
这件事为什么比你想的更难
这里要说一个沮丧的事实:即使你把以上每一步都做了,你也无法百分之百确定一个人是真实的。
这不是悲观,这是方法论上的诚实。
检测AI生成身份的本质,是一场一致性核查。你在做的,是收集足够多的信号,看这些信号能不能在独立来源之间互相印证。
如果一个人在十个不同的维度上都呈现出"真实"的特征,而且这些维度之间的逻辑关系是自洽的、难以整体伪造的,那么这个人大概率是真实的。
但"大概率"不是确定。
对抗也在升级。GAN和扩散模型的进化速度,始终比检测工具快一步。今天Hive Moderation能以99.9%的准确率识别某一类AI生成图像,是因为它是基于已知模型的输出训练的。
明天出现一个新模型,它的输出特征还没有进入检测系统的训练集,准确率就会下降。
这是一场没有终点的追逐。
所以最可靠的防御,不是找到一个万能的检测工具,而是建立一种思维习惯:在高风险场景——涉及金钱、涉及机密信息分享、涉及重要决策——任何人的身份都应该经过多维度的独立核查,而不是仅凭直觉或单一技术手段判断。
"那有没有可能整套流程都过了,这人还是假的?"
有。
这就是为什么最后那一关——要求对方提供具有时间特异性的、可独立核查的现实细节是不能省的。
一个真实的人,可以给你提供他上周去的那家餐厅的名字,然后你能在网上找到那家餐厅的用户评价,而且开业时间跟他的描述对得上。
| 当前新闻共有0条评论 | 分享到: |
|
||||||||||
| 评论前需要先 登录 或者 注册 哦 |
||||||||||||
| 24小时新闻排行榜 | 更多>> |
| 1 | 历史即将重演?官媒文章惊人弦外之音 |
| 2 | 梦魇再临?中国突发新冠肺炎公告 |
| 3 | 中南海最怕的真相,正在浮出水面! |
| 4 | 未来3年可能成白菜价的10样东西 别让资产变 |
| 5 | 重磅爆料:习近平正在为大战做准备 |
| 48小时新闻排行榜 | 更多>> |
| 一周博客排行 | 更多>> |
| 一周博文回复排行榜 | 更多>> |
| 1 | 南渡与北归:破灭之后的二次选 | 席琳 |
| 2 | 世纪之战: 大时代过客 | 菓趣 |
| 3 | 从国共内战到台海困局:大一统 | 一个人的公 |
| 4 | 美伊谅解备忘录丧权辱国。四大 | 雷歌747 |
| 5 | 川普已签:美伊谅解备忘录全文 | must |
| 6 | 京城四大无耻 之 老舍 | 席琳 |
| 7 | 签的是MOU,不是协议 | 倩影 |
| 8 | 社会主义,资本主义,马斯克主 | 山货郎 |
| 9 | 一百年来的中国动物保护 | 席琳 |
| 10 | 南渡与北归:那些著名的儿子们 | 席琳 |