这份AI通讯是你所需的一切 #55

AI通讯 #55

本周AI大事记 – Louie

本周,我们很高兴终于有机会测试OpenAI的Code Interpreter,这是GPT-4在ChatGPT内的一项新功能。OpenAI还发布了其他一些公告,包括计划在未来四年内建立一个专门致力于实现超级对齐的团队。

在初步的Alpha版发布后,Code Interpreter功能,包括编码和数据可视化能力,现已进入Beta测试阶段,适用于所有ChatGPT Plus用户。Code Interpreter赋予ChatGPT一系列功能,包括数据分析、图表创建、文件上传和编辑、数学运算以及代码执行等。

对于大多数用例来说,使用Code Interpreter相对简单,尤其对于分析师来说。数据,包括ZIP压缩文件等,可以通过点击加号按钮轻松上传。初始提示可以很简单,因为AI在理解数据含义和结构方面非常出色。一旦加载完成,AI会自动处理数据合并和复杂的数据清洗等任务。Ethan Mollick在他的Twitter和博客上记录了许多有趣的Code Interpreter用例。特别强大的是识别错误(由于代码执行失败)并使模型迭代以纠正错误的能力。

该功能可以用于许多独特的应用,人们已经记录了包括数据分析和可视化、趋势识别、主题分析、参与模式检查、SEO优化、KPI分析、视频创建甚至构建机器学习数据集和模型等用途。随着对Code Interpreter的访问不断扩大,这些可能性也在不断扩展。虽然近期ChatGPT的兴趣似乎有所减退(网站访问者下降的报道,尽管GPT-Turbo和GPT-4正在通过API在其他地方推广),所以这个新功能对于OpenAI来说是一个好时机。

我们认为Code Interpreter可以释放LLMs的更多能力,非常有用,大大降低了基本数据分析的成本和门槛。然而,它仍然需要人类监督和人类的想象力来提出正确的问题并获得最多的见解。我们预计,在未来几个月和几年中,在LLMs被赋予更强大的工具方面将会取得更多进展。

在其他AI新闻方面,我们在十月份介绍过的基于生成AI的教育初创公司Kinnu成功融资650万美元。Kinnu主要面向成年爱好者学习者,并利用AI为每个个体学习者优化内容。Kinnu的联合创始人兼首席执行官Christopher Kahler表示:“我们一直觉得大多数在线教育产品只是将传统学校的最糟糕的方面进行了扩展。”“我们相信,AI驱动的学习有着显著的机会,重点是加速人类学习的速度。”我们对Kinnu取得的进展感到非常高兴,并且对AI为增强教育做出贡献的潜力表示赞同。

– Louie Peters — Towards AI联合创始人兼首席执行官

最热门新闻

  1. 推出超级对齐

OpenAI引入了超级对齐的概念,强调确保高智能AI系统与人类意图保持一致的科学和技术突破的必要性。该组织强调建立创新的治理机构和探索新方法以实现这种对齐的重要性。

2. Miner将38000个GPU从加密货币转向AI

加密挖矿公司Hive Blockchain将重点转向AI工作负载,放弃以太坊挖矿。凭借38000个GPU的实力,他们打算在仍然利用一些GPU算力进行加密挖矿的同时,为AI计算赚取收入。然而,转向AI计算面临一些挑战,因为较旧的以太坊挖矿GPU在这个市场上的价值有限。

3. AWS推出1亿美元的生成AI创新中心

AWS宣布在生成AI的推进上进行了大量投资。新成立的AWS生成AI创新中心承诺投入1亿美元,旨在协助全球客户和合作伙伴释放生成AI的潜力。该创新中心已经与Highspot、Lonely Planet、Ryanair和Twilio等公司合作开展生成AI解决方案。

4. 谷歌的医疗AI聊天机器人已经在医院中进行测试

谷歌的Med-PaLM 2,一种用于提供有关医疗信息的AI工具,已经在梅奥诊所研究医院进行了测试。作为语言模型PaLM 2的一种变体,Med-PaLM 2在推理、提供一致支持的答案和理解方面表现出色,尽管仍存在一些准确性问题。

5. 阿里巴巴推出人工智能工具,可以从文本生成图像

中国科技巨头阿里巴巴推出了同一万象(Tongyi Wanxiang),这是一种人工智能工具,能够根据提示生成图像。该工具允许用户用普通话和英语输入提示,并生成包括2D插图、素描和3D卡通在内的各种风格的图像。

五篇5分钟阅读/视频,让您保持学习状态

  1. 量化尺度的有趣特性

最近的研究揭示了大型语言模型的训练后量化(PTQ)的质量受到预训练超参数的强烈影响。研究表明,优化选择,包括权重衰减、梯度裁剪和数据类型选择,对PTQ的性能有重要影响,float16和bfloat16显示出显著影响。该研究强调了在开发稳健语言模型时优化选择的重要性。

2. 为您的下一个项目选择最佳的机器学习GPU

本文介绍了机器学习中GPU的增加使用,并提供了选择最佳GPU(人工智能应用程序)的指南。文章提到了要考虑的关键因素,如兼容性和内存容量,并列出了来自NVIDIA的顶级GPU选项,包括Titan RTX和Tesla V100。它还提供了像EVGA GeForce GTX 1080和AMD Radeon GPU这样的性价比选择。

3. AI权重不是“开源”的

本文深入探讨了AI模型权重及其作为开源资源的可用性问题。文章认为,尽管AI模型的源代码可能是开源的,但权重(涵盖实际学到的知识)通常不会公开共享,这是出于对知识产权、隐私和商业利益等各种原因的考虑。

4. 人工智能词汇表:60+个需要了解的术语

人工智能正在以指数级增长,并且对其的认识有不同的层次。本词汇表旨在为那些刚刚接触人工智能的人提供资源,并为那些寻求参考或复习词汇的人提供帮助。

5. 在ChatGPT中开始使用代码解释器

在本文中,Ethan Mollick在Twitter上记录了许多有趣的代码解释器用例。他还强调了它的特点、使用过程等。

论文和仓库

  1. 大型语言模型评估综述

本文对语言模型的评估方法进行了全面的回顾。重点介绍了评估内容(包括推理、伦理和应用等各个方面)、评估位置(通用和特定基准)以及评估方法(包括人工评估与自动评估)。

2. DreamDiffusion:从脑电图信号生成高质量图像

本文介绍了DreamDiffusion,一种从脑电图(EEG)信号直接生成高质量图像的新方法,无需将思想转化为文本。通过利用预训练模型和先进的信号建模技术,它克服了信息有限和噪声等挑战。

3. LongNet:将Transformer扩展到10亿个标记

本文介绍了LongNet,一种Transformer变体,可以将序列长度扩展到10亿个标记以上,而不会牺牲较短序列的性能。它使用扩张注意力来高效处理较长的序列,同时保持对较短序列的性能。采用这种技术的一个关键优势是它与现有的优化方法兼容。它与已经使用的任何其他方法无缝集成,扩展了可供优化使用的选择范围。

4. 递归的诅咒:在生成数据上训练使模型遗忘

研究人员探索了“模型崩溃”现象,即当模型使用来自其他模型的内容进行训练时,原始内容分布的消失。这种现象影响了LLMs、变分自动编码器和高斯混合模型,强调了理解和保护来自真实人类互动的数据以维持网络收集数据的好处的必要性。

5. ChatLaw:集成外部知识库的开源法律语言模型

ChatLaw是一个专门为中国法律领域设计的开源法律语言模型。它利用向量和关键字检索技术相结合,解决了数据检索过程中模型产生的虚幻问题,从而实现更准确的响应。自注意力机制用于提高参考数据的准确性和可靠性。

喜欢这些论文和新闻摘要吗?在您的收件箱中获取每日摘要!

一起学习人工智能社区栏目!

每周AI播客

在本周的“What’s AI”播客中,Louis Bouchard采访了DeepMind的研究科学家兼剑桥大学的兼职讲师Petar Veličković。Petar分享了关于博士学位的价值的见解,强调其作为研究的门户和建立联系和适应性的机会的重要性。他还强调了AI研究的发展态势,强调了多元化背景和贡献的重要性。本次采访提供了关于学术界与工业界、研究科学家的角色、在DeepMind工作、教学以及好奇心在推动有影响力的研究中的重要性方面的宝贵观点。如果你对AI研究感兴趣,可以在YouTube、Spotify或Apple Podcasts上收听!

本周的梗图!

mrobino分享的梗图

来自Discord的特色社区帖子

weaver159#1651最近推出了一个名为MetisFL的新项目,这是一个联邦学习框架,旨在使开发人员能够轻松地将他们的机器学习工作流程联合起来,在分布式数据孤岛之间训练模型,而无需集中化数据。该框架的核心是用C++编写的,注重可扩展性、速度和韧性。目前,该项目正在从私有的实验版本过渡到公开的测试阶段。在GitHub上查看并支持其他社区成员。在此线程中分享对该项目的想法。

本周的AI投票!

加入Discord上的讨论。

TAI精选区

本周文章

比GPT-4更好的SQL查询:NSQL(完全开源)by Dr. Mandar Karhade, MD. PhD.

SQL仍然是最常用的语言。如果我们可以通过向一个大型语言模型提问来编写SQL查询,那将是很棒的事情吧?这将减少很多工作量,可能使公司中几乎每个需要的人都能获得洞察力。在这篇文章中,作者介绍了NSQL,这是一个专门设计用于SQL生成任务的新型开源大型基础模型(FMs)系列。

我们必读的文章

清晰解释分类指标!by Jose D. Hernandez-Betancur

释放数据洞察力:掌握强大的AI进行分析by Amit Kumar

认识Salesforce XGen-7B的完全开源基础模型by Dr. Mandar Karhade, MD. PhD.

如果你想在Towards AI上发表文章,请查看我们的指南并注册。如果符合我们的编辑政策和标准,我们将在我们的网络上发布您的作品。

职位招聘

数据架构师 @ShyftLabs(加拿大多伦多)

机器学习专员 — 法律系统 @Uni Systems(比利时布鲁塞尔)

图形AI研究开发人员 @Plain Concepts(远程)

数据工程师 @Tomorrow(自由职业/罗马尼亚)

增长经理,数据与分析 @WillowTree(远程)

客户平台工程师 @Chainalysis(远程)

实习生 — 软件工程实习生 — ACST @Activate Interactive Pte Ltd(新加坡)

有兴趣在这里分享一份工作机会吗?请联系[email protected]

如果您正在准备下一次机器学习面试,请毫不犹豫地查看我们领先的面试准备网站confetti!

https://www.confetti.ai/