AI 收藏夹 Vol.001:当你的语音助手不再温顺
人工智能是一门融合了计算机科学、图形学、生物学、语言学等学科的前沿科学。随着电子硬件的发展和算力的提升,人工智能的技术理论逐渐走向落地,各种应用和设想层出不穷,丰富了其内涵和外延。「AI ...
人工智能是一门融合了计算机科学、图形学、生物学、语言学等学科的前沿科学。随着电子硬件的发展和算力的提升,人工智能的技术理论逐渐走向落地,各种应用和设想层出不穷,丰富了其内涵和外延。
「AI 收藏夹」将会与大家分享一些 AI 领域实用和有趣的文章和工具,与大家一起见证技术的创新与变革。
文章
0 1
用卷积神经网络(CNNs)鉴定油画

2017 年 11 月 15 日,一幅耶稣的肖像在纽约以 4.503 亿美元的价格成交,这是迄今为止最昂贵的易手画作。然而,很多专家对这幅画的真伪提出质疑,指出画作经过修复,或非本人所做。
确定一件艺术品是否是真迹,需要对艺术家的风格和技巧进行精微的判断,这项任务很适合交给卷积神经网络(CNNs)。上图就是将神经网络应用于伦勃朗的画中。暖色部分表示,机器学习画师作品后判断该部分画作更有可能是真迹[1]。
在医学方面,巨大的组织学样本全幻灯片图像可能有数十亿像素大小,其中的细节信息同样非常丰富。科学家们正在尝试使用卷积神经网络自动化分析病理图像,捕获肿瘤细胞的表征。
0 2
在未来
还会有「婚礼摄像师」这个职业吗?

这篇文章[2]提出了一个设想:我们可以用 AI 自动处理视频剪辑。
让我们想象一下这个场景:婚礼上,亲朋好友们用手机录下现场的精彩瞬间,他们在同一个 App 里进行实时协作,AI 会自动根据光线、机位、声音效果检测每一段视频的质量,并自动剪辑其中精彩的段落。当新人接吻时,AI 还会识别到需要特写的场景,给手机一个反馈,触发手机拉近特写。这种多机位拍摄、多人协作的摄影模式,让摄影成为一种社交体验。你会期待这种「摄影社交」吗?
0 3
李逵变李鬼?
AI 改变视频制作范式

想象一下,你输入几行文字,一个明星就会在几秒钟内说出这些话。
计算机图形学家 Maneesh Agrawala 创建了一个视频编辑软件,只要有充足的原始视频,他就能让任何一个人说出他们没有说过的话。这些视频非常逼真,被称为「深度伪造」(Deepfake)。有了这项技术,电视和电影可以避免昂贵的重拍,声带受损的人可以用这项技术恢复他们自然的声音[3]……不过,关于「深度伪造」的伦理边界在哪里?这也是值得我们思考的问题。
0 4
用 AI 预测事故热点

通过分析过去四年的路况数据,AI 分析并预测出多个事故高风险区域(如右侧中部的圆点所示),而实际上这些地方暂未出现过事故。随后几年,这些地方真的出车祸了。
这篇论文名为《基于卫星图像和 GPS 轨迹的高分辨率交通事故风险地图推断》[4]。作者使用 AI 分析大量的卫星地图、 GPS 轨迹、道路地图和历史事故,生成了一张高分辨率的事故风险地图。
0 5
Feminist 机器人挑战我们的性别偏见

你有没有注意到,语音助手的声音默认都是女声?面对羞辱,语音助手可以反击和显得「不温顺」吗?
在这篇文章[5]中,作者做了一个儿童实验:女性语音助手将会反击那些含有性别歧视的语言。人机交互或许有可能纠正性别偏见、影响人的行为,而这个实验本身也正代表了一种立场。
工具
0 1
DeepFaceLive 实时换脸

🌟 功能:
-
对输入的摄像头视频流或本地视频文件进行实时换脸
👀 亮点:
-
五官无违和感
-
不同性别也可以替换
-
DeepFaceLab 中已有训练好的模型可使用
👉 地址:
https://github.com/iperov/DeepFaceLive
0 2
lxi.ai 让你的网页书签拥有「神经网络」

🌟 功能:
-
根据网页内容的不同,为书签页自动打上标签
-
根据标签,生成「神经网络」,标明关联性
👀 亮点:
-
通过 Chrome 插件收集和管理网页书签,方便
-
重合度较高的书签将会自动关联,形成复杂的网络
👉 地址:https://lxi.ai/
0 3
用 AI 让老照片焕发新生

🌟 功能:
-
修复划痕
-
色彩增强
-
面部增强
👀 亮点:
-
友好的图形用户界面
👉 地址:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life
参考资料:
[1] 卷积神经网络鉴定油画:https://spectrum.ieee.org/this-ai-can-spot-an-art-forgery
[2] AI 自动剪辑视频:https://spectrum.ieee.org/ai-video-editing
[3] 「深度伪造」视频:https://hai.stanford.edu/news/how-ai-changing-video-editing
[4] AI 预测事故热点:https://openaccess.thecvf.com/content/ICCV2021/papers/He_Inferring_High-Resolution_Traffic_Accident_Risk_Maps_Based_on_Satellite_Imagery_ICCV_2021_paper.pdf
[5] 语音机器人挑战性别偏见:https://spectrum.ieee.org/human-robot-interaction
Zilliz 以重新定义数据科学为愿景,致力于打造一家全球领先的开源技术创新公司,并通过开源和云原生解决方案为企业解锁非结构化数据的隐藏价值。
Zilliz 构建了 Milvus 向量数据库,以加快下一代数据平台的发展。Milvus 数据库是 LF AI & Data 基金会的毕业项目,能够管理大量非结构化数据集,在新药发现、推荐系统、聊天机器人等方面具有广泛的应用。
解锁更多应用场景
更多推荐
所有评论(0)