大数据文摘专栏作品
作者:Christopher Dossman
编译:Olivia、Junefish、云舟
呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!
AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。
每周更新,做AI科研,每周从这一篇开始就够啦!
本周关键词:GANs、Julia、强化学习
本周最火学术研究
训练单图像GAN的新里程碑
GAN的优势之一是能够生成与真实图像无法区分的图像。因此,只有它可以实现在有限域中收集大型数据集,促使了基于单一图像的学习生成模型的不断发展。但是,要获得可靠的结果一直是一个具有挑战性的问题。
为了解决训练生成方法的挑战,汉堡大学研究人员进行了许多实验,这给该领域带来了一线希望。继成功的实验之后,他们在最近发布的论文中提出了一些可以使机器学习在产生更好结果的实践。
与最新技术水平相比,该方法的训练速度快六倍,参数更少,并且可以更好地捕获图像的整体结构。
代码:
https://github.com/tohinz/ConSinGAN
原文:
https://arxiv.org/abs/2003.11512
稳健深度神经网络训练实用框架
在许多现代应用中,深度神经网络变得越来越重要。但是,深度学习网络的稳健训练仍然是一个巨大的挑战,此外,还有DNN容易受到对抗性攻击等问题。
这项研究是第一个实用的稳健训练框架,可支持大多数大型DNN模型所需的绝大多数操作。本文介绍了一种在流行的TensorFlow平台上开发的名为PaRoT的新框架,用于可验证的稳健训练,该框架可以直接在现有代码库上使用,并且只需很少的代码即可完成开发。
具体而言,该框架能够在任意DNN上执行强大的训练,无需任何模型重写。研究人员表示,该模型的性能可与最新技术相媲美,它还拥有在现有经过训练模型上的使用简便性,以及在现实世界的工业应用上的测试能力,如交通信号灯探测网络等。
原文:
https://arxiv.org/abs/2001.02152v3
使用SEED-RL进行可扩展的高效强化学习
不久前,Google研究人员团队推出了可扩展的高效Deep-RL(SEED-RL)代理,该代理可扩展到数千台机器,从而能够以每秒数百万帧的速度进行训练,显着提高了计算效率。该架构通过集中模型推断并引入快速通信层来大规模利用加速器(GPU或TPU)。如果你对RL感兴趣,那么本文将为你提供研究工作中的最新信息。
研究人员演示了SEED RL在流行的RL基准(例如Google Research Football,Arcade Learning Environment和DeepMind Lab)上的性能,并表明更大的模型可以提高数据效率。
代码:
https://github.com/google-research/seed_rl
原文:
https://arxiv.org/abs/1910.06591
通过学习3D图形来绘制线图
本文介绍了一种基于可微几何模块和图像翻译网络的组合来学习3D模型以生成线图的方法。
该方法的架构包括一个对3D模型的几何特征进行操作的可微模块和一个对基于视图的形状表示进行操作的图像模块。在测试时,神经模块将基于几何和视图的推理信息相结合来创建线图。
经过众包测试,该方法展现出了一定的优越性,其效果较现有最优几何和神经图像翻译方法在标准基准上有显著提升,其绘制的图纸甚至能与经验丰富的人类艺术家的作品相媲美。
原文:
https://arxiv.org/abs/2003.10333v2
机器学习语言Julia的算法,应用和待解决问题
机器学习技术的飞速发展推动了功能强大的新工具的诞生,其简化的操作和优异的性能令科学家们爱不释手。
Julia就是一个代表。它是一种用于科学计算和数据处理的开源现代编程语言,简单快捷、富有表现力且具备高性能,其运行效率几乎可以与静态编程语言(如C / C ++和Fortran)相媲美。
它在很多机器学习研究领域(比如模式识别、NLP、IoT数据分析、CV、自动驾驶、图形分析和信号处理等)都大有作为。此外,它还像R,Python和MATLAB一样易于使用,也因此正迅速成为数据科学和通用科学计算领域中一门竞争力很强的编程语言。
原文:
https://arxiv.org/abs/2003.10146v1
其他爆款论文
一个自动、可扩展且更准确高效的面部检测器AFSD:
https://arxiv.org/abs/2003.11228v1
无监督3D可控图像合成的首次尝试:
https://arxiv.org/abs/1912.05237v2
RL最优技术水平及经济学、博弈论、运筹学和金融学等多学科应用:
https://arxiv.org/abs/2003.10014v1
用于固有图像分解端到端3D重建方法:
https://arxiv.org/abs/2003.10432v1
基于文本值的小型企业违约预测:
https://arxiv.org/abs/2003.08964v1
数据集
大规模图像数据集,可显著提高立体超分辨率和自监督单眼深度估计等任务的结果:
https://github.com/leiainc/holopix50k
AI大事件
Julia1.4:功能更新、速度加快:
https://www.zdnet.com/article/programming-language-julia-v1-4-is-even-faster-and-brings-these-new-features/
Google AI支持教职科研的新方式:
https://ai.googleblog.com/2020/03/exploring-new-ways-to-support-faculty.html
Microsoft帮助启动C3.ai数字化转型研究所:
https://www.zdnet.com/article/c3-ai-microsoft-help-launch-the-c3-ai-digital-transformation-institute/
全世界应如何应对冠状病毒大流行
https://www.independent.co.uk/voices/coronavirus-covid-19-pandemic-outbreak-data-research-cdc-who-a9406281.html
本月访谈
Sarah Mestiri的职业发展路径:从软件工程师到数据科学家
大约3年前,Sarah辞去了软件工程师的工作,并开始努力成为一名机器学习专家。
她现在已经是一名数据科学家,就职于德国柏林的移动应用重定向公司Remerge GmbH。她正致力于通过利用最新技术解决现实问题,从而改善民生。
了解她的经历:
https://medium.com/@cdossman/how-sarah-mestiri-transitioned-from-a-software-engineer-to-a-data-scientist-972de50203fa