本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计98451 字,简读后为6255字,阅读时间为16分钟,为您提高阅读效率为1538%
- 创业公司在2024年必须制定计划和预算,用于人工智能辅助软件开发 🤖
- OpenCV笔记(19):霍夫直线检测 📐
- LangChain - 2023年人工智能发展回顾 💡
- 生成式人工智能创建聊天应用 💬
- 语料泛化三种可行方案介绍 📖
- 我使用谷歌的新型AI艺术自拍照功能变成“戴珍珠耳环的少女” 🖼️
- 大模型量化技术原理-LLM.int8()、GPTQ 🔢
- NVIDIA人工智能研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理” 🤔
- ClickHouse(03)ClickHouse怎么安装和部署 🛠️
- 为满足欧洲DMA法案,Opera将为苹果iOS用户推出非WebKit内核的全新AI浏览器 🌐
要点解析:
-
随着AI技术的迅速发展,越来越多的企业开始将AI技术应用到软件开发过程中,并取得了较好的效果。AI技术可以帮助开发者完成某些任务,从而提高他们的工作效率,并解放出更多的时间专注于更具创造性的工作。
-
然而,在使用AI技术时,企业也应该注意AI的以下潜在风险。AI技术可能会产生错误结果,因此企业在使用AI技术时应该进行严格的测试和验证,以确保AI技术能够正确地完成任务。AI技术可能会造成偏见,因此企业在使用AI技术时应该注意避免AI技术产生偏见,以免导致不公平的结果。
-
此外,AI技术可能会与现有系统产生冲突,因此企业在使用AI技术时应该注意避免AI技术与现有系统产生冲突,以免导致系统故障。
https://techcrunch.com/?p=2657408
要点解析:
-
美国政府将推出“了解你的客户”云计算服务规定,要求美国云计算公司确定包括中国在内的外国实体是否正访问美国云数据中心以完善其 AI 模型。
-
该规定将要求美国云计算公司通过“了解你的客户程序或客户识别程序”,来验证注册或登录美国云计算账户的外国人身份,并设定识别外国用户的最低标准,要求云计算公司每年进行合规性认证。
-
美国政府此举引发质疑,有专家认为这可能会阻碍国际合作。
https://m.cnbeta.com.tw/view/1414457.htm
要点解析:
-
印度 AI 初创公司 Krutrim 宣布获得 5,000 万美元融资,公司估值达到 10 亿美元,成为印度首家人工智能独角兽企业。Krutrim 专注于构建印度完整的 AI 计算堆栈,并已推出自己的大语言模型和 AI 服务器。
-
Krutrim 的大语言模型以印度本土的数据为重点,号称使用超过 2 万亿个语料库进行训练,为各种印度语的生成式 AI 应用提供动力,支持无缝的多语言切换。
-
Krutrim 计划在今年推出名为 Krutrim Pro 的多模态 AI 模型,该模型将具备更高级的问题解决能力与任务执行能力。
https://www.ithome.com/0/747/606.htm
要点解析:
-
1X 公司是一家挪威的人形机器人初创企业,由 Bernt Øyvind Børnich 于 2014 年创立,总部位于挪威,前身为 Halodi Robotics。1X 公司的主要产品是 EVE 和 NEO 两款机器人,其中 EVE 是一款轮式机器人,主要用于工业、物流、零售和安全领域,而 NEO 则是一款双足机器人,身高 165 厘米,体重 30 千克,具有行走、面部表情沟通、提高操作效率、保障用户安全性等功能。
-
1X 公司通过自研的具身学习(Embodied Learning)AI 技术训练机器人,通过 VR 技术,1X 操作员在工作室中进行远程操作,引导机器人完成各种真实场景,从而有效地将人类智能与人工智能效率结合起来。此外,1X 还通过共享自治(shared autonomy)的过程,创建了一个宝贵的数据反馈回路,进一步增强了机器人的学习适应能力。
-
1X 公司在 2021 年 3 月拿到 1300 万美金的 A 轮融资,又在 2023 年 4 月拿到 OpenAI 旗下创业基金领投的 A2 轮融资,获得了 OpenAI 的投资资金和技术支持,借助 OpenAI 的 GPT 系列模型,1X 机器人的拟人化能力得到了显著提升。
https://www.ithome.com/0/747/650.htm
要点解析:
-
欧盟苹果要求允许开发者提交独立浏览器应用,Opera将在欧洲为iPhone和iPad用户推出一款基于自家引擎的、以AI为中心的Opera One for iOS浏览器。
-
Opera作为欧洲领先的浏览器开发商,很乐意接受DMA带来的变革,并对苹果公司宣布的新的互操作性申请表感到兴奋,这将允许开发者提交更多与iPhone和iOS硬件和软件功能的互操作性申请。
-
Opera One浏览器,已经可以在中国官网下载,包括MacOS、Windows和Linux版本,虽然官网并未提供中文选项但浏览器支持中文。
https://www.ithome.com/0/747/676.htm
要点解析:
-
马斯克宣布特斯拉将从英伟达和 AMD 购买芯片,用于应对人工智能的计算硬件支出狂潮。
-
特斯拉今年将在英伟达的硬件上花费超过 5 亿美元,并计划在 2024 年年底之前投资超过 10 亿美元,用于名为“Dojo”的内部超级计算机项目来处理大量数据。
-
特斯拉走“英伟达和 Dojo 的双重道路”,但 Dojo 存在很大的风险,回报却可能很高。
https://m.cnbeta.com.tw/view/1414527.htm
要点解析:
-
苹果正在测试其 AI 功能,例如新版 Siri 语音助手,代码显示苹果正在进行相关测试,然后在内部将其结果与 ChatGPT 结果进行对比。
-
iOS 17.4 代码中包含了一个名为 SiriSummarization 的新框架,这个框架会调用 OpenAI 的 ChatGPT API,iOS 17.4 中还为 SiriSummarization 框架加入了多个提示语,包括像是 “请总结...”;“请回答(这个问题)”和“请总结(给定文本)”这样的案例。
-
苹果还在 iOS 17.4 中为 SiriSummarization 框架加入了多个提示语,包括像是 “请总结...”;“请回答(这个问题)”和“请总结(给定文本)”这样的案例。
https://www.ithome.com/0/747/668.htm
要点解析:
-
谷歌Bard借助Gemini Pro模型的更新登上ChatBot Arena排行榜第二名,可能很快将成为最强AI模型Gemini Ultra。
-
Bard在支持互联网检索后,对于实时信息问题的回复表现提升巨大。
-
OpenAI的GPT-4 Turbo新版模型在总结应用上有所退步。
要点解析:
-
近日,三星发布旗下最新款智能手机 Galaxy S24 系列,同时官宣其先进人工智能技术“Galaxy AI”将率先搭载于旗下部分老款设备,包括全线 Galaxy S23 系列、Galaxy Tab S9 系列以及新近上市的 Galaxy Z Fold5/Flip5。
-
值得注意的是,上述设备均为今年发布的新品,在三星客户体验部负责人——Patrick Chomet 的声明中,AI应用暂不计划扩展至更早年份的机型,如Galaxy S22 等。
-
Chomet 表示:“为了随着时间推移确保AI体验能得到足够性能支持,部分功能需要CPU与GPU的匹配。”三星需要确保所有功能品质与性能,待观察Galaxy AI在 S24 系列上的工作表现,再决定是否于下一代产品(即 S23 及相关扩充版本)中加入。
https://www.evolife.cn/mobile/316011.html
要点解析:
-
2023年,随着ChatGPT的兴起,生成式人工智能(GenAI)引起了广泛关注。各企业都在探索将GenAI应用到现有产品中的方法。
-
目前,检索技术是结合数据和大语言模型的流行方法。LangChain提供与60多种向量存储的集成,简化了检索过程。
-
LCEL(LangChain表达式语言)是LangChain的一个新功能,它提供了一种轻松组合不同组件的方法,非常适合构建复杂且个性化的解决方案。
https://juejin.cn/post/7328670028604850188
要点解析:
-
浦科化学是上海AI实验室最新开源的科学大模型,基于书生·浦语2.0强大的基座模型能力,通过注入海量化学专业数据,使大模型获得理解和处理化学相关专业任务的知识与能力。
-
在化学领域,浦科化学超越ChatGPT,在分子名称转换、分子性质预测、反应产物预测等任务上表现出色,证明其在理解和处理化学知识方面具备强大能力。
-
同时,浦科化学在数学、物理及推理方面的能力也得到提升,说明当对大模型进行化学专业训练时,其数理及推理能力也能得到增强。
http://www.qbitai.com/?p=117161
要点解析:
-
作为 InternLM 一代模型的升级,InternLM2-Chat 凭借多项升级及优化,在推理速度、对话体验和工具调用能力上都有不俗的表现.
-
InternLM2-Chat 也是一款功能非常全面的对话模型,支持 20 万字超长上下文,实现长文对话 “大海捞针”、采用 T5 架构,支持工具调用能力,能够在一次交互中多次调用工具,完成相对复杂的任务.
-
InternLM2-Chat 搭配现有的 LMDeploy 工具,提供一键部署的功能,支持 gradio 和 streamlit 等多种交互页面,有效降低使用门槛,方便个人/企业快速上手使用.
https://juejin.cn/post/7328388226967257088
要点解析:
-
联想至像今日首发 AI 语音控制打印机,现有的 WIFI 功能的打印机也开放升级语音功能,兼容性很强。用户可以通过联想至像 App 和小程序实现语音控制打印功能,后续还将支持直接与打印机进行语音交互。
-
目前,智能打印机的语音控制功能可实现语音指导、语音控制、故障排查、耗材更换等操作,为用户带来便捷的打印体验。
-
其实这不是联想至像第一次将 AI 功能应用在打印机上,去年的联想至像 Z1 多功能作业打印机就搭载了基于智谱 AI 的 ChatGLM 千亿大模型,可用于作业指导、知识点选取、语言输入等,满足了家长和学生的多样化打印需求。
https://www.ithome.com/0/747/622.htm
要点解析:
-
生成式人工智能等技术融入到聊天应用程序中,能够促进各种形式的数字交流,例如用户之间的文本、语音和视频聊天。生成式人工智能驱动的聊天应用程序可以参与开放领域的讨论,适应不断变化的对话环境,甚至生成创造性或复杂的对话。
-
微软指南用于在LLM生成响应时编写有效的系统消息,分为四个部分:定义模型的目标用户以及其功能和限制,定义模型的输出格式,提供展示模型期望行为的具体示例,提供额外的行为保护。
-
聊天应用程序的人工智能模型具有学习和适应能力,为用户提供个性化体验。通过用户个人资料等功能定制用户体验,不仅让用户感到亲切,而且还有助于他们得到特定答案,创造更高效、令人满意的交互。
https://juejin.cn/post/7329033935491956745
要点解析:
-
微软宣布,Windows 11 的 Voice Clarity 功能将登陆所有配备 x64 处理器的电脑,而不仅仅是 ARM64 芯片。
-
Voice Clarity 是一项在后台运行的功能,可在通话过程中实时改善语音品质,使用"低复杂度人工智能模型"抑制背景噪音;消除回声和减少混响。
-
所有使用"传统"英特尔和 ARM 处理器的用户都可以通过 Windows 11 Canary Channel build 26040 试用该功能。
https://m.cnbeta.com.tw/view/1414493.htm
要点解析:
-
大模型「Copilot」宣布对外开放「文生图」功能,升级后的 GPT3.5 中文能力整体超过 GPT3.5,代码能力大幅提升 20%,达到业界领先水平,同时腾讯自研的面向垂直领域的 7B 和 13B 模型也首次亮相。
-
基于通用大模型,Copilot 目前已经接入了 180 个腾讯内部业务,例如:腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等涵盖广泛的使用场景,最近,QQ 浏览器还基于 Copilot 推出了「PDF 阅读助手」,具备智能摘要、智能问答和多轮提问等功能。
-
据了解,腾讯掌握从模型算法到机器学习框架再到 AI 基础设施的全链路自研技术,这为大模型的快速迭代提供了有利条件。自首次公开亮相以来,Copilot 大模型进入了加速升级的轨道。在自研算法的支持下,模型稳定性和可靠性稳步提升。
https://juejin.cn/post/7328325259197874239
要点解析:
-
OpenAI宣布发布GPT-4 Turbo,在代码生成等任务中表现出色,并解决用户提出的"偷懒"问题。
-
GPT-4 Turbo 在 2023 年 4 月的数据上进行了训练,目前处于预览阶段,超过 70% 的用户已从标准 GPT-4 转向 GPT-4 Turbo。
-
OpenAI 还推出了用于检索增强生成的小型人工智能模型 embeddings,可用于文本到图像生成等任务。
要点解析:
-
智能客服的优化离不开泛化语料库的支撑。在智能客服系统开发的早期阶段,采用单个词的泛化处理策略,利用同义词替换和标准词库来优化语料库,提升智能客服对用户指令的理解能力。
-
随着数据积累和用户反馈的丰富,文本泛化方法应运而生。将经过精心标注的泛化数据输入机器学习模型,培养出具备高效短文本泛化能力的模型,实现更广泛的文本泛化。
-
从长期来看,场景泛化能力的深化和扩展成为关键。将用户意图的共通性作为模型训练的权重因素,实现场景之间的泛化,同时兼顾不同场景的精准和个性化服务。
https://juejin.cn/post/7329033776856334387
要点解析:
霍夫变换是一种基于霍夫空间的图像特征提取算法,可以用于检测图像中的直线,圆形,椭圆等形状.
霍夫直线检测是霍夫变换的一种应用,可以检测图像中的直线,即使这些直线重叠或被遮挡.
霍夫变换对噪声敏感,在使用前应对图像进行降噪处理.
https://juejin.cn/post/7328670028605079564
要点解析:
-
ClickHouse 是一种分布式列式数据库管理系统,专为处理大数据而设计。它具有高性能、高可用性和可扩展性,适用于各种数据仓库和实时分析场景。ClickHouse 可以处理各种数据类型,包括数值、字符串、日期、时间戳、数组和嵌套数据结构。
-
ClickHouse 采用列式存储格式,可以快速压缩和检索数据。它还支持多种数据压缩算法,可以进一步提高存储效率。ClickHouse 的查询引擎非常高效,可以快速处理复杂查询,即使是处理大量数据也可以在几秒内完成。
-
ClickHouse 支持多种数据写入方式,包括批量导入、实时流式写入和分布式写入。它还提供丰富的查询语言,支持各种聚合函数、窗口函数和子查询。ClickHouse 可以与多种编程语言集成,包括 Python、Java 和 C++。
https://juejin.cn/post/7328431191601594394
要点解析:
-
近年来,随着Transformer;MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大模型压缩技术来降低模型部署的成本,并提升模型的推理性能.
-
当前,大模型量化主要包括有:剪枝(Pruning);知识蒸馏(Knowledge Distillation);量化.其中,量化主要分为几个方面:权重量化;激活量化;KV Cache量化;等等.
-
针对大模型量化技术,LLM.int8()以及GPTQ两种方法的效果较好.在权重量化与混合精度分解的情况下,LLM.int8()通过提取异常值(离群特征)单独计算,只对剩余特征做量化,从而恢复全部性能.而GPTQ是一种仅权重量化方法,它使用int4/fp16 (W4A16)的混合量化方案,在推理阶段,模型权重被动态地反量化回 float16 并在该数值类型下进行实际的运算.
https://juejin.cn/post/7328404758011625510
要点解析:
-
1 月 27 日,乘联会崔东树发布数据显示,2023 年我国汽车行业收入破 10 万亿,同比增长 12%.小米 SU7 车型曝光,预计将搭载 8 英寸 LCD 屏幕,并与小米平板 7 系列实现协同联动.
-
任天堂下一代 Switch 掌机爆料,预计将于今年推出,配备 8 英寸 LCD 屏幕,芯片将更容易找到.亚马逊中国电脑端服务正式关闭,仅提供 App 和微信小程序,不再提供 Prime 会员服务.
-
微软游戏业务进行重大调整,暴雪总裁宣布离职,旗下动视暴雪和 Xbox 将裁掉 1900 名员工.
http://www.geekpark.net/news/330898
要点解析:
-
近日,伊利诺伊大学香槟分校的研究团队发布了一篇综述报告,概述了将代码集成到LLM训练数据中的各种好处。
-
研究人员观察到一个普遍的趋势,即LLMs生成编程语言或利用预定义的函数来建立与其他功能终端的连接,即「以代码为中心」的范式。
-
代码执行提供了可靠和可定制的反馈,但尚未建立一种完全利用这种反馈的完美方法。
要点解析:
-
苹果公司宣布将在下个月举行年度WWDC(苹果全球开发者大会)。作为一家市值2万亿美元的科技巨头,苹果在每年的WWDC上发布的新品,总是能引起业内外的广泛关注。巧合的是作为苹果公司内部的竞争对手,Reality Labs所推出的VR/AR设备「Project Cambria」也被传将于今年秋季推出。两家公司的产品都将主打VR/AR技术。
-
值得注意的是,这两款产品都将支持视网膜投影技术。但一个值得注意的细节是,苹果的眼镜配备了专门的Micro OLED显示屏,据悉分辨率高达3000PPI,而Meta的眼镜则使用了聚焦波导光学技术。
-
此前,包括苹果、Meta在内的科技巨头也在VR/AR领域投入了大量财力、物力。Meta日前发布的虚拟现实头戴设备Meta Quest Pro售价高达1,500美元,但据悉首批出货量仅为10万台。可以想象,VR/AR市场依然处于发展初期,还需要时间和技术储备。
https://techcrunch.com/?p=2657445
要点解析:
-
人工智能(AI)将改变数据分析,数据工程师需要学习如何应用AI技术,以提取更多价值和洞察。
-
人工智能可以减少数据映射工作,让工程师有更多时间专注于数据策略和数据架构。
-
商业智能(BI)分析师需要掌握更多技能,以提供动态、互动的报告,满足业务领导者的需求。
https://venturebeat.com/ai/how-data-engineers-should-prepare-for-an-ai-world/
要点解析:
-
最近,一张涉嫌造假的泰勒·斯威夫特的人工智能图像在网上流传。这些图像未经泰勒·斯威夫特本人或其团队的同意就创建并传播,违反了基本伦理道德。涉及的AI系统,包括Stable Diffusion、Telegram、Twitter和X,都面临着严重的道德问题。
-
事件发生后,一些AI项目开始关注道德实践,例如Polyjuice和Generated Photos,致力于在生成图像时获得个人的同意和授权。
-
这起事件表明,我们需要对AI的生成进行紧急的道德监督,以防止进一步的滥用,包括未经同意传播的深度造假、信息误导和虚假宣传。
https://openaimaster.com/?p=33935
要点解析:
-
NVIDIA AI 研究科学家 Jim Fan 在 TED 分享了对通用人工智能的研究框架与目标。他认为通用人工智能应同时具备技能、具身形式和感知现实的能力,当前的研究应朝向右上方,即三个轴均有不错能力的智能体。
-
他介绍了其领导的研究项目 Voyager。Voyager 可以不断地在《我的世界》游戏中学习和掌握多种技能,且能发现新技能。其核心是将编码作为行动,不断尝试、反思和改进,终身学习。
-
他还介绍了 MetaMorph 和 IsaacSim 等研究项目,分别用于控制不同形态的机器人和加速物理模拟。最终目标是创造出具备三个轴能力的 Foundation Agent,并认为未来所有可以移动的东西都将实现自主控制。
https://juejin.cn/post/7328339779505455145
要点解析:
-
10月28日,360安全卫士与猎豹移动创始人周鸿祎、傅盛两位科技圈大佬罕见坐一起,宣布双方共同创立一家人工智能公司,引发业界广泛关注。
-
据了解,周傅二人相识于早期在360共事期间,其后傅盛创办猎豹移动并与360展开一系列商业竞争。这次和解标志着两人恩怨纠葛的结束,也标志着双方将在AI领域展开深入合作。
-
对于此次合作,外界普遍认为是双赢之举,360可以借助猎豹移动在AI领域的积累,进一步提升自身AI技术水平,而猎豹移动则可以利用360的平台和资源,扩大其AI产品的市场份额。
https://juejin.cn/post/7328366295090888742
要点解析:
-
使用生成式AI来模拟已故亲人的个性和样貌的纪录片电影《永恒的你》最近引发了关于这项技术是否在帮助人们处理悲伤还是造成伤害的争论。有些人认为与人工智能互动可以帮助人们处理情感或想法,而另一些人则认为它可能会导致否认死亡和延长悲伤过程。
-
Project December是Jason Rohrer开发的一款人工智能聊天机器人,允许用户模拟与已故亲人的对话。Rohrer表示,他的目标是创建一个艺术和娱乐研究系统,但用户却更喜欢用它来模拟已故亲人。他承认有些人可能有令人沮丧或痛苦的经历,但仍认为人们应该能够自由使用这项技术。
-
悲伤咨询师和死亡学专家对使用人工智能模拟已故亲人持谨慎态度,认为这可能是一把双刃剑。他们认为这可能会帮助人们处理情绪或想法,但也可能导致否认死亡和延长悲伤过程。
要点解析:
-
33岁日本作家Rie Kudan的小说《Tokyo-to Dojo-to / Tokyo Sympathy Tower》在AI辅助下创作,斩获日本顶级纯文学奖项芥川奖,评委一致称赞近乎完美无瑕。
-
Kudan在获奖感言中表示,ChatGPT帮助自己释放了潜力,成为她创作过程中的伴侣,她将AI视为灵感的来源。她在创作之余也会与AI交流,倾诉无法与他人诉说的心事。
-
然而,用AI参与创意内容的创作也引发了争议,人们担忧AI是否会对文学的未来造成影响。由于AI系统会使用大量其他作家的作品训练,存在照搬文本、侵犯版权的潜在风险。
要点解析:
-
谷歌推出Art Selfie 2功能,用户可以使用生成式AI将自拍照融入25种以上的艺术风格中,体验不同时代和流派的艺术作品。
-
该功能重新构想了一种绘画方式,Art Selfie 2使用生成式AI将用户的自拍照与艺术风格融合,形成一种全新的艺术风貌,使用户可以以另一种方式欣赏艺术作品。
-
Art Selfie 2也是一个了解艺术知识的平台。通过该功能,用户可以了解到每幅画作背后的故事和艺术家生平,以及各个艺术流派的发展历程,从而产生对艺术的兴趣。
https://www.businessinsider.com/google-art-selfie-2-generative-ai-app-2024-1