4 篇博文 含有标签「ChangeLog」
查看所有标签2024-07-21 AI Resource Recommendation
2024-07-21 AI Resource Recommendation
Recommend some interesting and useful resources that I have collected recently👍
It is divided into four parts: tool, course, book and blog.
Welcome to contribute~
2024-06-30 AIGC Daily Archive
𝟎𝟔𝟐𝟗 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🙅 OpenAI推出CriticGPT,以发现人工智能生成的代码中的错误和错误
- 🤖 Agility的人形机器人将处理你的Spanx:Digit的第一份工作是在佐治亚州Spanx工厂周围移动塑料手提袋
- 🤔 Instagram开始让一些创作者自己制作AI版本:Meta正在推出其AI Studio工具作为早期测试
- 😄 谷歌放弃了重大更新。它发布了两个新的开源模型Gemma 2 9B和27B。Gemini 1.5 Pro的2M令牌上下文窗口现在向所有开发人员开放。Gemini 1.5模型现在可以在AI Studio和Gemini API中运行代码
- 🔢🤖 微软文本转语音虚拟数字人上线,支持GPT-4o的集成,可以创建实时互动的数字人
- 📹 Runway 昨天晚上向所有 CPP 创作者开放了 Gen-3 的测试权限。 目前只能文生视频,单次最多可以生成十秒,没有上线控制方式,不能向后延长
- 👍 Luma上线指定首帧和尾帧生成视频的功能,可以通过文字提示实现光线变化、转换角度等效果。也可以实现面部表情变化的控制(排队排到天长地久😭
🧰 AI新工具
- 1️⃣ Listnr - 允许用户从超过1000个语音的文本中创建逼真的画外音(19美元/月)
- 2️⃣ 尤里卡健康 - 世界上第一位人工智能医生(目前专攻甲状腺和糖尿病)
- 3️⃣ C.AI推出角色呼叫-与AI角色交谈,就像你在电话中交谈一样
𝟎𝟔𝟐𝟕 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🤠 玩具反斗城使用OpenAI的Sora制作一部关于其起源故事的品牌电影
- 👬 Anthropic的最新更新在Claude中引入了“项目Projects”。项目有一个200k令牌上下文窗口,接受自定义文档、大型代码库和自定义指令(为每个项目调整Claude的个性)。Claude还进行了重新设计,具有可搜索的聊天历史记录等功能(团队版GPTs)
- 🤖 ChatGPT的 macOS 桌面应用程序现已向所有用户上线。快捷方式 Option + Space 将带你到 ChatGPT。Mac应用程序还可以选择搜索你的聊天历史记录(ChatGPT Web没有)
- 🍠 Figma 昨晚终于做了他们最应该做的功能!PPT 制作和演示工具 Figma Slides
- 😱 glif:轻量版的Coze,插件没那么多,但是支持Canvas,出了Meme这一个小应用就火了。配置流程很简单。使用应该是sonnet3.5
🧰 AI新工具
- 1️⃣ QPNotes - 允许用户按主题或目的对提示进行排序和组织,以便快速访问(免费最多150个提示)
- 2️⃣ Claude Engineer - 通过命令行接口 (CLI) 访问 Claude 3.5 Sonnet ,内置文件操作和网页搜索功能
- 3️⃣ 简易文件夹 - 帮助ChatGPT和Claude用户通过创建文件夹和子文件夹来组织聊天历史记录的工具(6.99磅/一个月)
0626 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🍎 Apple x Meta失败了☹️,主要是隐私协议谈崩了
- 📧 Gmail的Gemini AI边栏和电子邮件摘要现已推出:谷歌正在为付费客户添加Gemini AI功能,以向文档、工作表、幻灯片和驱动器
- 🤔 Etched正在推出其定制芯片Sohu,专为 transformer 设计,在Llama 70B上每秒输出50多万个代币。比NVIDIA即将推出的怪物GPU【GB200】快一个数量级
- 👂听说豆包 MarsCode 发布会上宣布的云顿AI IDE能直接在浏览器上写代码,无需配置环境?
- 💯 极客公园搞了一个国内模型高考题测试,字节豆包的文科成绩拉满了。仅次于GPT4o超过了一本线21分,用的还是地狱难度的河南卷子和分数线。历史得分甚至超过了GPT-4o
- 😼 Notion发布Notion Sites 一键建站工具
- 📹 Video-Infinity: 分布式生成长视频| 分布式推理的方法,在多个GPU上并行生成长视频。可以在5分钟内生成95秒长度的视频,生成长视频的速度比之前快100倍
- 🔊 ElevenLabs 推出 ElevenLabs Reader 语音阅读器,输入任何文档,如:如文章、邮件、PDF 和 ePub等文件,直接可以帮你转成AI真人语音播报
🧰 AI新工具
- 1️⃣ Stackbear - 一个无代码平台,允许您根据自己的内容创建自定义AI聊天机器人(免费)
- 2️⃣ Evoke Music - 专为视频、播客和业务需要音乐的内容创作者而设计(每月8美元)
- 3️⃣ Fibery AI - 一种由人工智能驱动的工具,有助于在单一环境中进行头脑风暴、写作、任务自动化和过程实验(每月10美元)
0625 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🔍 Perplexity 首席执行官Aravind Srinivas回应了抄袭和侵权指控:Srinivas试图将责任推给“第三方网络爬虫”,拒绝识别哪些爬虫,表示停止这样做太“复杂”,并表示忽视robots.txt在技术上并不违法
- 🤯 出于监管问题,苹果不会在欧盟市场推出人工智能技术。(所以欧版没有苹果智能吗)
- 👬👬多人协作工具 Multi 被 Open AI 收购了。Multi 可以实现在系统层面的多人协作,可以多人控制一台电脑。看来 Open AI 想要对办公协作软件场景下手了?
- 🐢 ChatGPT 4o 的实时语音功能 ios 端界面开始灰度了,但目前只是一个空的 UI 界面而已,还未实际连接到模型
- 🎵 索尼、环球音乐、华纳起诉 Suno 和 Udio, 1首歌索赔 15 万美元
- 😭 OpenAI 7月9号 直播封号,今天向使用API的开发者们群发邮件,将会限制非支持地区的API流量
- 🎉 硅基智能将其DUIX(Dialogue User Interface System)开源了,DUIX是2D 真人级、AIGC 实时渲染数字人模型!
🧰 AI新工具
- 1️⃣ Fathom - 记录、转录、突出显示和总结会议的人工智能会议助理(免费)
- 2️⃣ Glarity - 适用于YouTube、谷歌、Twitter和任何网页的开源ChatGPT摘要扩展(12.49美元/月)
- 3️⃣ Course.im - 使用AI创建一个课程并将其添加到你的网站
0624 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
- 最近做了几件大事,耽误了日报更新,收到了大家催更的动力,现在回来啦~
🤯AI大事件
- 🚑 Stability AI 获得救助:前Weta Digital首席执行官Prem Akkaraju在Emad Mostaque最近离职后接任;He、Sean Parker和其他投资者也在向该公司注入现金
- 🎨 ComfyUI 作者、StableSwarmUI作者、ComfyUI-Manager作者等 ComfyUI 核心贡献者一起成立了Comfy Org
- 🔢🤖 HeyGen 公司 CEO 兼创始人 Joshua Xu 的采访:Heygen 公司的使命是通过 AI 替代传统摄像头,使视频内容创作变得更加普及和个性化。他们的技术可以生成全身 AVATAR,并通过 AI 编辑将其组合成最终视频。
- 🍎 苹果正在与 Meta 进行谈判,将其人工智能模型整合到 Apple Intelligence 中,对于 Apple 来说,确保多种型号的安全可以为用户提供尽可能最佳的体验
- ⚙️🐶 机器人公司 Unitree 发布了其 Go2 机器狗的新演示。视频中,狗展示了倒立、翻转、承受和调整力量的能力,表现出极高的精确度和敏捷性
- 🎓 OpenAI CTO Mira Murati 在接受采访时表示,相比 GPT-3(幼儿)和 GPT-4(高中),下一代 GPT 将是“博士级别”, 下一个型号将在一年半后发布
- 👀 Grok 代码现在列出了 Midjourney。这暗示传闻中的合作伙伴关系可能很快就会直接在 X 上包括 xAI 聊天机器人中的高级图像生成模型
🧰 AI新工具
- 1️⃣ Banner GPT - 一种为博客文章生成横幅图像的人工智能工具(免费)
- 2️⃣ RTranslator - 开源实时翻译应用,可以离线在安卓设备使用
- 3️⃣ Robin.L 整理的Coze bot列表,根据其中的点赞数和介绍,可以挖掘自己的产品方向
𝟎𝟔𝟎𝟔-𝟎𝟕 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 📹 快手发布了可灵视频生成模型,支持生成最长两分钟 30FPS 1080P 的视频(可惜今天已经申请不了内测)
- 🔊 紧接着GLM4,Qwen2 系列模型发布! 包括 0.5B、1.5B、7B、57B-A14B 和 72B 5 种大小版本, 模型在同尺寸模型的测评中,都获得了超越所有开源模型的成绩
- 升级最新版的ChatGPT客户端会发现多了一个功能“后台对话”,也就是当你切换的时候,GPT 语音功能也能保持在线,应该是为苹果WWDC准备的😎
- 🎵 Stability AI 推出AI音乐,体验不如udio & Suno
- 🧱 Adobe要求用户所有项目可访问并用于训练AI和内容审查
- 🔐 OpenAI概述了其保护其ai研究基础设施的安全措施。这包括使用Azure、Kubernetes和身份管理系统的多层方法。模型权重也通过多方批准、私人链接和出口控制得到保障。(裁了安全团队但离不开安全)
- 🔊 Seed-TTS: 由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型
🧰 AI新工具
- 1️⃣ Contentinator - 帮助生成文本、图像并提供文案写作帮助的Figma插件(每月5美元)
- 2️⃣ BiRead - 即时双语阅读的简单工具
𝟎𝟔𝟎𝟓 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 📼 WWDC内容预测: OpenAI加持下的Siri具有增强的功能和新的声音|照片中的人工智能照片编辑和清理,笔记中的转录和总结,以及信息中的人工智能生成的回复和表情符号| Safari 中的智能搜索和人工智能回顾功能
- 🎈 智谱发布新的GLM 9B系列开源模型,性能提升40% 超越Llama 3,GLM 4V 9B能力支持1M无损上下文,26种语言,函数调用能力提升40%,比肩GPT 4V
- 💥 数名OpenAI、谷歌DeepMind现任和前任员工签署公开信警告人工智能风险
- 🆚 Character AI 推出了他们全新的语音电话功能,CAI用传统模型技术做出了和 GPT4o同级别的延迟水平。经过权威多轮测试,两者延迟相差仅100ms
- 微软发布首个大气AI基础模型Aurora🌀 在不到一分钟的时间内,Aurora 就可以生成 5 天的全球空气污染预测和 10 天的高分辨率天气预报
🧰 AI新工具
- 1️⃣ Groqbook - 使用Groq和Llama3在几秒钟内生成整本书
- 2️⃣ Cobalt,一个开源视频下载工具,支持B站、YouTube、Instagram和Twitter视频下载
- 3️⃣ Agently-Daily-News-Collector - 基于LLM的新闻自动收集器, 可根据主题关键词,自动完成新闻汇总报告的结构设计、栏目组稿
𝟎𝟔𝟎𝟒 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🤯 根据英伟达的幻灯片显示,GPT-4 是 1.8T 参数的混合专家模型。现在用 Blackwell 系统实际上可以在大约十天内训练一个像 GPT-4 这样拥有 1.8 万亿参数的大模型
- 🚀马斯克宣布 Starship Flight 4 计划于周四发射! 主要目标是在重返大气层期间更深入进入大气层,最好是通过最大加热。
- 🈯️ Meta的人工智能负责人抨击埃隆·马斯克炒作、阴谋论,“ 只要符合他的利益,他似乎就会毫不犹豫地传播疯狂的阴谋论 ”
- 👋 Meta正在使用 Facebook 和 Instagram 帖子来训练人工智能
- 🎮 著名的英雄联盟解说 Tyler1 发布了一个英雄联盟助手,可以在你玩游戏的时候用他自己的声音跟你聊天,教你玩游戏。
🧰 AI新工具
- 1️⃣ Deepshot 2.0:AI 口型同步和生成,无限制
- 2️⃣ Lawformer AI:将您的文档数据库转变为人工智能驱动的库。
- 3️⃣ Audioatlas - 允许用户从超过2亿首歌曲的庞大全球数据库中找到最合适的音乐(免费)
- 4️⃣ Namelix - 帮助企业想出简短、朗朗上口和有品牌的名字(免费)
𝟎𝟔𝟎𝟑 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🎵🆚 Suno正在举办 夏日音乐大赛, 前三甲将分别获得 1 万美元、7500 美元和 5000 美元的丰厚奖励
- 🤖 OpenAI再次招聘其机器人团队。2020年,他们放弃了机器人计划,致力于语言模型。现在,他们又回到了机器人
- 📈 Nvidia 首席执行官黄仁勋宣布推出下一代“Rubin”芯片,计划于 2026 年推出,“Rubin Ultra”将在一年后推出。“拥有数百万个 GPU 数据中心的时代即将到来”
- 😂 针对斯坦福团队的Llama3-V项目抄袭国内MiniCPM-Llama3-V 2.5项目,斯坦福团队负责人出来道歉了
- 🧙♂️SD3 Medium 模型将在 6月12日(下周三)正式开源
- 🤔 18家AI搜索的测评结果已正式发布, Perplexity、ChatGPT、360 AI 搜索、百川进入高分组
- 💥ElevenLabs 已经提供了由 AI 生成的人声和音乐。现在,它还允许人们为播客、电影或游戏创建音效
🧰 AI新工具
- 1️⃣ Graphite: 专为主题SEO(Topical SEO)设计的AI驱动平台
- 2️⃣ illuminate:谷歌新项目、将论文转换为通俗易懂的对话音频
𝟎𝟓𝟐𝟗-𝟎𝟓𝟑𝟏 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
本来想换成双日报or周报|但发现自驱力比不上日报😭
🤯AI大事件
- 📣 OpenAI成立了一个新的安全委员会,并暗示了新模型。Sam Altman是这个新的安全和安保委员会的负责人之一。根据公告,OpenAI最近开始训练其下一个前沿模型,并期望它解锁新功能。
- 👊 前OpenAI董事会成员Helen Toner声称,Sam Altman没有通知董事会关于ChatGPT的信息,而是她通过Twitter才发现的。她甚至指责Altman有时“彻头彻尾地撒谎”,让董事会对OpenAI的项目和安全工作一无所知。而这件事还有后续!OpenAI 董事会成员 Bret Taylor 和 Larry Summers 援引律师事务所的外部审查,为 Sam Altman 和公司的安全承诺进行了辩护。
- 📰 OpenAI将Vox Media和The Atlantic添加到他们的新闻合作伙伴库中。OpenAI还与WAN-IFRA合作,启动一个加速器,以帮助新闻编辑室快速采用人工智能。
- 🔒Jan Leike在辞去OpenAI的Superaliment联合负责人职务几周后,加入Anthropic担任新的安全负责人
- 🏃♀️ Gemini 1.5 Pro以1268 Elo在LMSYS排行榜上排名第2。Gemini Advanced(Elo:1267)就在3点的后面。谷歌正在迅速缩小其模型与OpenAI的GPT-4o(Elo:1287)之间的差距。
- 🧑💻 Mistral AI发布了一个新的编码LLM。Codestral是一个22B参数模型,在基准上,它击败了CodeLlama 70B和Llama 3 70B。它还有一个32k令牌的上下文窗口。
- 🎵 Udio反应很快,Suno更新后就放出Udio-130 新模型,能够两分钟的片段,具有长期的连贯性和结构。
- 📈 Perplexity 推出了 Pages,这是一种将研究成果转化为文章、报告和指南等视觉内容的新工具。
- 🖊️ PixVerse发布了自己的运动笔刷功能, 通过手绘箭头自定义每个区域的运动方向和距离,比 Runway 的通过滑块更方便和直观。
🧰 AI新工具
- 1️⃣ GetGloby - 使用人工智能将广告和营销资产转换为100多种语言(8美元/月)
- 2️⃣ GPTinf - 一种旨在重新措辞AI生成的内容以绕过AI剽窃检测器检测的工具(12美元/月)
- 3️⃣ Ankara AI -一个使用人工智能为视频生成旁白的应用程序(免费)
- 4️⃣ Teno Chat - 一个智能Discord机器人,旨在加入语音频道,收听和转录会议(免费)
𝟎𝟓𝟐𝟕-𝟎𝟓𝟐𝟖 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🍎 苹果的WWDC将包括人工智能生成的表情符号和OpenAI合作伙伴关系
- 🎵 🎵 🎵 Suno支持采样任何一段声音直接生成音乐
- 👬 Microsoft 推出了第一个 @Telegram 机器人:Copilot for Telegram,一款由 GPT 提供支持的免费 AI 伴侣
- 💰 xAI 目前的估值约为 OpenAI 估值的 1/3。Elon Musk 和 xAI 刚刚宣布有史以来最大的 B 轮融资,筹集 6B 美元,用于训练新版本的 Grok
- 🎉 Open-Sora Plan v1.1.0更新, 得益于ShareGPT4Video 具有注释长视频的功能,可以生成更高质量和更长的视频
- 🆚 国内外各家模型的长文本能力对比|国内推理速度还要加把劲啊
- 🌍 Cohere 发布 Aya 系列模型, 支持 101 种语言的响应
- 😺 字节跳动推出了专门的 AI 陪伴型机器人应用猫箱,以及针对 AI 绘画以及 AI 写真的应用星绘,其中猫箱的聊天记录会跟豆包同步。
🧰 AI新工具
- 1️⃣ ChefGPT - 一个由人工智能驱动的食谱推荐工具,根据您拥有的成分和工具推荐食谱(免费)
- 2️⃣ PDF Candy - 允许用户将文件转换为PDF格式(3.60美元/月)
- 3️⃣ Pseudoface (降价)-生成想要保持匿名的内容创作者可以使用的人工面孔(0.99/月)
- 4️⃣ Synthetic Users - 用AI合成模拟真实用户,用于调研访谈
𝟎𝟓𝟐𝟒 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💰 阿里巴巴财报披露,于2024财年向AI初创公司月之暗面投资合共约8亿美元,购入约36%股权
- ⬇️ 英伟达为中国市场开发的H20人工智能芯片起步不顺,供应过剩,定价比华为昇腾910B低10%以上
- 😵💫 国内外AI大模型API价格汇总🚀(更新到134个API)
- 🧑🏫 OpenAI 的前首席科学家 Ilya Sutskever 开出了一份论文清单(30篇论文)。 他说:"如果你真正学会了所有这些,你就会知道当今 AI 的 90% 重要内容。"
- ☎️ Arc Search 带来全新玩法:Call Arc|支持和AI模型通话
- 🤯 东部时间凌晨 3 点左右,微软必应出现问题,导致 Copilot、DuckDuckGo 和 ChatGPT 的搜索功能瘫痪
- 🔧 Mistral 7B发布v0.3版本, 支持function calling
- 🐆 Krea Al开放视频生成功能,擅长关键帧生成视频
- 🌊 海艺上线了 Comfyui 工作流的云端服务| 与其他家不同的是他们对 Comfyui 做了很多深度的定制来保证体验
- 🧙♂️ GPT-5即将到来,或许会叫GPT-Next -Microsoft Build会议记录
🧰 AI新工具
- 1️⃣ SocialStats: 帮助用户在社交媒体上通过定制品牌动画视频/GIF 来提高互动率。
- 2️⃣ ComfyFlowApp: 用于从ComfyUI工作流中开发AI Web应用并与他人共享的工具,旨在降低使用ComfyUI的门槛
𝟎𝟓𝟐𝟑 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🦎 Meta公布了Chameleon,一款用于多模式任务的人工智能,擅长图像字幕和视觉问题回答(VQA)等任务,同时在纯文本任务中也表现出强大的性能。
- 🎉 Adobe Lightroom获得了Firefly AI驱动的“生成删除”编辑功能。 通过生成删除,用户可以从任何照片中删除不需要的对象
- 🎁 字节的 Coze 海外版已经支持 GPT-4o
- ✅ $NVDA 发布第一季财报,收入同比增长 262% 数据中心增长达 427%,业务毛利率 70%
- 👀 Perplexity 与 TakoViz 合作推出高级知识搜索和可视化功能
- 🤔 2024 Microsoft Build 大会纪录 | 新的Phi-3多模态模型和GPT-4o & 奥特曼最后时刻现身Microsoft Build发布会
- 🔊 Truecaller与微软的Azure AI Speech合作,让用户通过录制他们的声音,然后克隆生成一个AI版本的用户语音。Truecaller助手能够使用你的声音自动接听电话、筛选来电、留言、代用户回复或录音。
- 🌊 百川发布Baichuan4模型和百小应A助手| 官方宣称Baichuan4中文评测国内第一,百小应具有联网搜索能力
- 🍍 马斯克的xAI正在制作Grok多模态版本
🧰 AI新工具
- 1️⃣ YaatriAI - 一个旅行规划平台,根据用户的偏好和预算提供个性化的行程(免费)
- 2️⃣ Krizmi - 一个交互式学习平台,提供自动生成的抽认卡和测验,以帮助学生保留和测试他们的知识(免费)
- 3️⃣ 吉言卡片:就是本期日报的页面设计支持APP(iOS APP Store8块/月)
0522 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💻微软推出 Copilot+ PC ,将提供“回忆”功能,使用AI为在PC上完成和看到的所有内容创建可搜索的“照片存储器”,支持运行 40多种人工智能模型,包括 GPT-4o
- 🤔 在OpenAI解散安全团队后,Anthropic反思了其负责任扩展政策 (RSP), 重点是解决灾难性的安全故障和前沿模型的滥用
- 🎉 ChatGPT 改进的数据分析功能开始推送了,让你可以与表格和图表进行实时互动,并能直接从 Google Drive 和 Microsoft OneDrive 添加文件。
- 🐳 微软 CTO Kevin Scott 今天在邀请 Sam 上台前分享的两张图:对比 2022 年支持 GPT-4 的算力,微软现在支持 OpenAI 下一代模型的算力量变成了巨鲸;Scaling Law 还将继续,下一代模型的能力会有巨大提升
- 💦 字节,阿里大模型降价,百度两款大模型APi & 讯飞星火 Lite API 直接免费, AI应用层开始逐步免费。
- 🚀 马斯克预告 Starship 在最近两周将迎来第四次试飞
🧰 AI新工具
- 1️⃣ SmartLinked - 用 AI 帮助个人改善他们的LinkedIn个人资料(免费)
- 2️⃣ Droppedhub - 一个根据关键词分析和市场差异化来策划和排名过期域名列表的平台(19刀/月)
- 3️⃣ Securewoof - 一款人工智能驱动的恶意软件扫描仪,用于检查可执行文件的恶意性 (免费)
𝟎𝟓𝟐𝟏 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- (0513-0517回顾)上周发布会和瓜不断,日报都装不下了
- 周二 OpenAI春季发布会
- 周三 Google IO发布会 & Llya 离职
- 周五 OpenAI宣布解散安全团队
- 周日 OpenAI澄清股权风波
- ⚠️ 担任公司超级调整团队联合负责人的Jan Leike(负责确保人工智能系统与人类价值观保持一致)因对优先事项的转变存在分歧而离开了公司。
- 🤔 谷歌 Gemini 1.5更新一份技术报告。该报告有很好的技术细节|Gemini 1.5 Pro与Claude 3 Opus相似,但不如GPT-4o|Gemini 1.5 Flash的性能与Claude 3 Sonnet相似,但比Haiku更快、更便宜| 谷歌还构建了两个专业模型:用于数学的Gemini 1.5 Pro,在MATH基准上得分为91.9%(超级高),以及Flash 8B,甚至比Gemini 1.5 Flash还要小。
- 🧑🎨 viva:首个可供使用的 Dit 架构视频生成工具(Sora同款), 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频。
- 🤯 微软搬迁位于中国的人工智能员工
- 😒 OpenAI 停止在语音功能中提供“sky”女声,原因是用户抱怨 sky 模仿了斯嘉丽·约翰逊| 寡姐回应去年九月 Sam Altman曾邀请我为GPT4配音,但当时她拒绝了
- 🎈《气球人》第 2 集 —— 失落 |Shykids 与 Sora 联合制作, 真人拍摄 + Sora 生成,然后剪辑在一起
- 💻 Microsoft 公布了 Copilot Plus PC:世界上第一台“AI 优先”PC|Copilot+ PC 的 AI 工作负载运行速度比传统 PC 快 20 倍,效率提高 100 倍,比 Macbook Air M3 快 58%。
🧰 AI新工具
- 1️⃣ Vidnoz - 一种工具,允许用户只需选择照片并编写脚本即可创建会说话的数字人头像视频(免费)
- 2️⃣ Audio Native by ElevenLabs - 可嵌入的AI音频播放器,可自动讲述您的博客或新闻网站
- 3️⃣ Blackbox -允许用户从视频、图像、PDF和其他格式中复制代码(免费)
- 4️⃣ FotoFix - 一个由人工智能驱动的工具,可以修复旧的和模糊的图像或增强新的图像(免费)
- 5️⃣ 「松鼠快看」: PC端能查看你订阅的公众号/小报童/小宇宙更新 ,最近还只支持了B站,YouTube
𝟎𝟓𝟏𝟎 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💃 阿里发布通义千问 2.5 ,宣称全面赶超GPT-4 Turbo,中文能力地表最强|基准测试OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo。
- 😭 Stability AI 推出了一个Stable Artisan产品。用户可以在Discord上使用 SD 3 进行图像生成与编辑 | SD3应该是不会开源了
- 🐼 🦒 😺 👬 谷歌DeepMind公布了其人工智能模型AlphaFold的改进版本,该模型不仅可以预测蛋白质的结构,还可以预测生物体中发现的所有类型的分子
- 🎵 Gemini 即将支持播放 YouTube Music 中的音乐
- 🧑🏫 短期课程推荐 - DeepLearning. Al 的 《使用LlamaIndex构建代理RAG》
- 🥳🎺🎵ElevenLabs AI Music推出早期版本|链接中的所有歌曲都是由单个文本提示生成的,无需编辑
- 📹📼 Krea AI 推出一款视频生成工具: Krea Video,它通过关键帧和文本提示生成视频,用户可以在时间轴上灵活移动和调整它们
🧰 AI新工具
- 1️⃣ Passphoto - 一个由人工智能驱动的工具,允许用户选择他们的国家并生成符合所需规格的护照照片(4.95美元)
- 2️⃣ Wonderplan - 人工智能驱动的旅行行程规划器根据您的兴趣、偏好和预算生成量身定制的旅行建议(免费)
- 3️⃣ Checkmyidea - 一项由人工智能驱动的服务,帮助企业家评估他们的副业想法,并提供行动计划路线图(9.9美元/1个想法)
𝟎𝟓𝟎𝟗 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- ✂️🎵 Udio 推出Audio Inpainting,允许无缝编辑和细化音轨| 可以根据周围的上下文选择要重新生成的轨道的一部分(更多更新)
- 🔔 微软正试图解决为生成性人工智能模型创建有效提示的问题,计划将 Microsoft 365 的Copilot更新一系列新功能。
- ✍️ OpenAI正推出一种新工具,识别DALL-E 3创建的图像。在内测中,该工具在大约98%的时间内准确检测到DALL-E 3图像,即使它们被修改,例如通过压缩、裁剪或饱和度变化
- 📁 OpenAI正在开发一个名为“媒体管理器”的工具,供创作者控制AI对其作品的使用 ,预计2025年推出
- 🧑🏫 Open AI 公布的《模型行为塑造指南》|指导模型遵守适用法律、 乐于助人、 不要试图改变任何人的想法等
- 🎉 IC-Light:调整图片的光照|ControlNet作者的新项目|输入图片,按文字描述调整光照效果
- 💼 微软与LinkedIn的2024工作趋势报告:分析了生成式AI如何重塑工作和劳动力市场,覆盖31个国家的3.1万名受访者|75%的全球知识工作者已使用生成式AI,79%的领导者认为AI是竞争力关键
- 📈 360 AI搜索增长率达到1300%,跃升至国内第一,用户体验相对良好,产品效果对普通用户很友好
🧰 AI新工具
- 1️⃣ GPT提示工程师-一种使用GPT-4和GPT-3.5-Turbo为特定任务生成和测试提示的工具(免费)
- 2️⃣ Photo2Math - 通过提供分步解决方案来帮助用户解决复杂的数学问题(免费)
- 3️⃣ VLM-1 by Autonomi AI - Vision API从图像、视频和文档中提取结构化JSON
𝟎𝟓𝟎𝟖 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🫠 GPT2重现LLM竞技场, 这次有了2个版本:im-a-good-gpt2-chatbot和im-also-a-good-gpt2-chatbot(确定不是起名废吗?)
- 📅 OpenAI可能会推迟本应在本周四(即5月9日)举行的公司活动。目前无法访问search.chatgpt.com。此外,chat.openai.com现在会被重定向到chatgpt.com
- 🍎Apple 发布会完整回顾| M4芯片版 iPad Pro & iPad Air 常规升级 & Apple Pencil Pro
- 🔊 亚马逊去年首次宣布其测试版工具以来,已有4万多本人工智能叙事书涌入亚马逊的有声读物平台Audible,允许自行出版的作者为其电子书生成人工智能“虚拟语音”旁白
- 👂 AI加强版 YouTube的“Jump Ahead”允许用户跳到视频的相关部分
- 🤖 Elicit已将其机器学习的内部阅读列表公开。涵盖了从初学者到前沿技术的整个范围
- 🌈 Open AI 最新文章《我们在人工智能时代对内容和数据的态度》| 模型可以陈述事实,这些事实属于公共领域。如果在极少数情况下,模型无意中重复了富有表现力的内容,则表明机器学习过程失败
- 🌍 人工智能公司的版权诉讼地图|单是OpenAI 就面临四家公司的诉讼
🧰 AI新工具
- 1️⃣ AIPhotoeditor - 一款由人工智能驱动的照片编辑工具,允许用户从图像中轻松删除不需要的物体、人物、瑕疵或文本(免费)
- 2️⃣ Supertone Shift - 人工智能驱动的实时语音转换器
- 3️⃣ VLM-1 by Autonomi AI - Vision API从图像、视频和文档中提取结构化JSON
𝟎𝟓𝟎𝟕 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🔮 🦙微软将推全新自研 AI 模型「MAI-1」,规模足以与谷歌、Anthropic,乃至 OpenAI 的先进模型相抗衡。 MAI-1 将有约 5000 亿个参数。GPT-4 有超过 1 万亿个参数,Meta 和 Mistral 等公司发布的小型开源模型则有 700 亿个参数
- 🍎 苹果将用自研 AI 模型 Ajax 优化 iOS 18,但不会推出「聊天机器人」
- 🤯 之前禁止用AI发表内容的Stack Overflow 宣布与 OpenAI 合作, 为 OpenAI 提供数据训练模型和 API|OpenAI 提供模型授权给 Stack Overflow 开发 OverflowAI
- 📣 Sam Altman关于AI和AGI的斯坦福大学演讲的关键见解| 奥特曼对GPT-4的表现表示失望,称其“有点尴尬”。| 实现人工智能(AGI)的成本对他来说不是问题(完整要点)
- 🏃♀️ 马斯克将使用X和Grok创建实时人工智能新闻,为了加倍推出一项名为“X上的故事”的新功能。这些将把推文视为新闻消息,而不是使用传统的媒体文章。
- 📈 Runway 的人工智能电影节从2023年的300份作品增加到2024年的3000多份作品
- 🆚🦙 DeepSeeK放出236B参数的MoE模型,激活参数是21B。他家的MoE模型架构特殊,激活参数少,同时性能基本等同于一半参数的稠密模型。所以性能号称和Llama3 70B对标。 License 商用友好,没有太多限制。
- 😺 歸藏(guizang.ai)推荐👍 Animatediff 作品, 作者用 Blander 制作很简陋的动画,再用 Animatediff 转绘的(动作幅度大且流畅),还公布了制作过程
🧰 AI新工具
- 1️⃣ HireMatch - 一种自动化的IT招聘工具,通过根据工作要求分析和评分简历,为人力资源经理节省时间(免费)
- 2️⃣ Zoviz - 一个由人工智能驱动的品牌平台,允许用户只需点击几下即可创建专业徽标和品牌资产(6美元一次性付款)
- 3️⃣ Flowrite - 一个Chrome扩展,帮助用户以5倍的速度编写电子邮件和消息(4美元/月)
𝟎𝟓𝟎𝟏-𝟎𝟓𝟎𝟔 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🔮 Midjourney放宽访问限制,现在允许任何使用基于Discord的机器人创建>100张图像的人使用Web界面
- 💫 Anthropic推出Claude移动应用程序,推出新的团队计划(一比一对比GPT了)
- 📳 Nvidia的ChatRTX现在支持更多的AI模型和语音查询, 除了Mistral和Llama 2外,用户还可以使用谷歌的Gemma、ChatGLM3和OpenAI的CLIP模型等,是本地聊天机器人最佳选择之一
- 📹 使用OpenAI的Sora模型生成的第一个音乐视频- 以Washed Out的歌曲《The Hardest Part》为主题的音乐视频
- 👋 Chrome上的Gemini-在Chrome地址栏中键入@gemini快速调出Gemini
- 🎵 🎵 🎵 Udio - 立即创建更连贯的曲目。生成长达2分钟,延长至15分钟
- 🎵AI音乐工具Udio更新,单次生成从30s增加到两分钟,音轨最大长度扩展至15分钟,适合长篇混音和复杂音乐制作
- 🔍 OpenAI或将推出搜索引擎 searchgpt。它正在为search.chatgpt.com注册SSL证书。预计发布日期是5月9日
- 🦙 🦙 🦙 在发布 Llama 8B的 100K 上下文版本后,Gradient又发布了 Llama 3 70B的100K 上下文版本。
🧰 AI新工具
- 1️⃣ Keyframes Studio - 一个为社交媒体平台创建、编辑和重新利用视频的一体化平台(9美元/月)
- 2️⃣ AutoThread AI - 一键从播客和YouTube视频生成Twitter线程的工具(0.5美元/视频)
- 3️⃣ MagicStock - 使用人工智能以PNG格式创建无限的照片、图标、插图和徽标(12美元/月)
- 4️⃣ Pix2Pix视频-一个允许用户上传短视频剪辑的工具,并提供他们希望如何看到该视频更改的文本说明(免费)
0430 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🔮 LMSYS 竞技场突然上线了一个叫 gpt2-chatbot 的模型,这是全网唯一可以访问它的地方,没人知道是谁制造了它,居然还拥有 GPT-4 级的性能,有可能是GPT5
- 😵💫OpenAI的Sora短片背后的现实:影片实现上涉及编辑、色彩校正和大量后期制作工作 |我们之后将带来逐帧分析🤯
- 🏎️第一场A2RL比赛见证了AI赛车手的不足 | 赛车会随机转弯、旋转、与墙壁碰撞,或者干脆离开赛道进行意外突破
- 英国《金融时报》正在将其文章授权给OpenAI。你现在将在GPT的回复中看到总结的FT内容,并带有指向来源的链接。
- 🏃♀️ 🏃♀️ 🏃♀️ 🏃♀️ 🏃♀️ 🏃♀️ 以嵌套网页形式展示搜索结果的产品globe,接入了Gorq,速度快到离谱。一秒钟展示一个概念的所有内容。
- 🤯 GitHub 发布 Copilot Workspace 预览版本| 开发者可以将一个概念或想法输入到 Workspace,系统将自动构建出实现该想法所需的整个开发计划。
- 🌛 Kimi 昨晚悄咪咪更新了自己的智能体功能,叫 Kimi+ 。 首批 Kimi+ 的内容都很有用。如什么值得买驱动的商品挑选,还有翻译、内容改写。
🧰 AI新工具
- 1️⃣ Imagetocaption - 一款由人工智能驱动的工具,可自动为社交媒体图像生成SEO优化的字幕(10.80美元/月)
- 2️⃣ AlphaCTR - 一个由人工智能驱动的平台,帮助用户快速创建高性能缩略图和广告创意(5美元/月)
- 3️⃣ Perplexica - 一个人工智能搜索引擎|Perplexity的开源替代品(👍又赚到了)
0429 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
长按扫码直接看详细版🎉
🤯AI大事件
- 🔍 OpenAI自己的的 AI 问答搜索引擎 SearchGPT 曝光| 支持 :通过聊天问答形式搜索全网任何内容 & 支持图像搜索 & 支持交互式的后续追问
- 😊 Huggingface 推出的模型推理服务|支持已有模型的一键部署 & 支持私有模型通过 docker 镜像部署|价格也比 replicate 要低一些。
- 🆓 使用免费的 google colab 在任何 1,500 行或更少(大约)的数据集上训练 llama-3-8b
- 🤷 马斯克想通过传票询问Helen Toner为什么离开OpenAI, 去年OpenAI内部的“宫斗”事件,其中Helen Toner是关键人物之一
- 🔥☁️ Extropic发布热力学计算机:利用物质随机波动驱动计算。比传统计算机快速,节能,适用于强大概率AI算法。
- 🎨 DomoAI 新增四种艺术风格:乐高、美国漫画、彩笔、像素艺术。
- 🍎苹果正在重新考虑与 OpenAI 合作,将 OpenAI 的功能集成到 iOS 18 中。
- 🤖 星尘智能S1新一代AI机器人| 可以模仿人类动作迅速做出学习,而且灵活性极强 & 演示视频为1倍速,和人类的速度几乎同步
- ⏳ Sanctuary AI推出了第七代凤凰人形机器人, 学习执行新任务所需的时间从几周减少到不到24小时
🧰 AI新工具
- 1️⃣ Wepik - 一个在线AI设计平台,提供各种设计模板和工具来创建专业图形(免费)
- 2️⃣ LongShot AI - 一个由人工智能驱动的长格式内容助理,可帮助用户研究、生成和优化内容(免费,19美元/月)
- 3️⃣ Friend - 开源AI可穿戴录音设备(赚到了)
0426 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💥 英伟达以7亿美元收购了人工智能工作负载管理初创公司Run:ai
- ❄️ Snowflake 发布了 面向企业的北极|Arctic -480B参数模型,有128个MoE。
- 🎭 Synthesia 推出虚拟数字人 Expressive-1,能通过脚本预测表情,实现表情和声音同步。
- 🔢🤖 阿里巴巴EMO项目内测上线,支持基于照片和音频的视频生成。目前还是固定模版,自由度较低。
- 🔧 Cohere开源的工具包,用于开发RAG应用,可以一键部署到微软Azure上,也可以本地部署
- 🎨 华为的DiT生图模型 PixArt-sigma:生成6K图片。
- 恭喜🎉通往AGI之路一周年!访问量破千万
🧰 AI新工具
- 1️⃣ Viroll - 一种人工智能驱动的视频编辑工具,可帮助用户创建视频中的精彩片段(免费)
- 2️⃣ Book Witch - 一个软件即服务平台,允许用户通过简单的描述生成电子书(5 美元/月)
- 3️⃣ Mindie - 允许用户与网络上遇到的任何内容进行对话,如 YouTube 视频、博客文章(免费)
- 4️⃣ Contentinator - Figma 插件,可帮助生成文本、图片并提供文案协助(5 美元/月)
0425 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💥马斯克: 特斯拉“可能”到2025年开始销售擎天柱机器人 Optimus
- 🌳 OpenAI的Sam Altman 大力投资绿色能源,因为电网无法满足人工智能技术不断增长的电力需求
- 🍎苹果低调研究LLM。这一次发布了新型号家族OpenELM的权重。它可以在iPhone上顺利运行。
- 🤔 Open AI升级了其API,使其更加企业友好。Azure和OpenAI之间有一个“私人链接”,以避免互联网暴露。同时加入之前的升级,如项目、助理API v2和成本管理功能。
- 🔊 OpenVoice V2版本发布 ,支持英语、西班牙语、法语、中文、日语和韩语,能克隆任何声音,用多种语言说话,并可控制情感
- 🧵 世界上第一台 @NVIDIA DGX H200,由 Jensen 手工交付给 OpenAI,致力于“推进人工智能、计算和人类发展(相当于250块 80G显卡,30台 A800 整机)
- 🦐 Llama3 不同量化方法评估了性能损失, 如果追求无任何性能损失,8B模型用8bit量化,70B模型用4bit量化。如果能接受2-3%损失,8B模型用4bit量化,70B模型用3bit量化。
- 🤔腾讯基于LLM的小微助手,主要是对话式文件/应用搜索; 类似Perplextiy 的增强搜索问答;微信对话平台接入支持,类似Agent坪台。
🧰 AI新工具
- 1️⃣ FindWise - 人工智能驱动的搜索助手,允许用户根据网站内容提问并获得答案(免费)
- 2️⃣ LOVO AI - 一个AI画外音和文本到语音平台,提供100种语言的500多个类似人类的声音库(每月4美元)
- 3️⃣ Fliki - 提供基于脚本的编辑器,允许用户将他们的想法、博客、演示文稿或推文转换为令人惊叹的视频(14美元/月)
0422-0424 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💥微软推出新的小型人工智能模型——Phi-3-mini, 该模型“与GPT-3.5一样强大”,同时足够小,可以在智能手机上运行
- 🎨 Adobe旨在通过在本周的Max伦敦会议上发布其第三代型号Firefly Image 3
- 😋 可口可乐推出了一种由AI驱动的仪器来捕捉可乐的声音, SoundZ,允许用户创建模仿打开和啜饮可乐的声音的音乐
- 🏥 Profulent设计了一个AI基因编辑器,可以成功编辑人类基因组。这样做的目标是为各种疾病创造一次性的治疗方法。
- 🧑🏫 吴恩达 X Mistral 的 Sophia Yang, Ph.D. 推出使用Mistral的简短课程。
- 🎵 Drake的新歌使用人工智能生成的Tupac和Snoop Dogg人声。AI音乐成为主流?
🧰 AI新工具
- 1️⃣ Portaly - 允许用户为其网站创建可定制的bio链接登陆页面(免费)
- 2️⃣ SurgeGraph - 一个SEO工具集,使用50多个SERP数据点来帮助生成SEO优化的内容
- 3️⃣ Intellisay - 通过早上录入2分钟语音,让AI来组织你的一天
- 4️⃣ Pezzo AI - 一个开源平台,允许用户高效地构建、测试、监控和部署人工智能模型(免费)
- 5️⃣ GetGloby - 使用人工智能将广告和营销资产转换为100多种语言(8美元/月)
0419 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🦙🦙🦙 Llama3 问世!推出 8B 和 70B版本 | 即将推出的 Llama-3-400B+ 标志开源社区获得 GPT-4 级模型权重的分水岭时刻。测试指标已经和 GPT- 4-turbo 以及 Claude-3-Opus 相差无几(还有9个关键点)
- 📚📚📚 OpenAI为 Assistants API带来了更新。开发人员现在可以为每个 Assistants 添加10, 000个文件,管理输入和输出令牌,并指定在文件搜索、代码解释器或自定义功能工具(⬆️500X)
- 👾Reddit计划新的人工智能功能, 更快的加载时间,增强版主和开发人员的工具,以及人工智能驱动的语言翻译功能,旨在使Reddit更具全球包容性。
- 📿 在围绕Humane AI的AI Pin的批评中,一种新的AI可穿戴设备 Limitless Pendant 已经进入市场。(录音笔Plus +++)
- 🖱️ 罗技宣布推出带有匹配鼠标的AI Prompt Builder软件
- 🪧 FameFlow - 在人工智能生成的广告中合法使用名人。
🧰 AI新工具
- 1️⃣ Pix2Pix视频-一个允许用户上传短视频剪辑的工具,并提供他们希望如何看到该视频更改的文本说明(免费)👍
- 2️⃣ Teach-O-Matic - 帮助用户从文本说明创建操作视频的工具(开源)
- 3️⃣ Audioatlas - 允许用户从超过2亿首歌曲的庞大全球数据库中找到最合适的音乐(免费)
- 4️⃣ Careered - 一个在线平台,帮助用户从简历和工作列表创建求职信(免费)
0418 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
长按扫码直接看详细版🎉
🤯AI大事件
- 🤖 波士顿动力发布全新电动Atlas机器人|停止开发液压动力版本,转向全电动。|新电动Atlas特点包括180度头部旋转,自我恢复能力,紧凑转弯能力。
- 🎨 Stable Diffusion 3 API发布。SD3在文字到图像生成领域性能优越,特别是在字体和提示遵循方面。
- 📈 Anthropic的Claude 3 Opus模型现在可以在Amazon Bedrock上买到
- 🎵 亚马逊音乐的Maestro是一个新的AI播放列表生成器,可以挑战Spotify
- 🧑🤝🧑👬OpenAI的API仪表板中,您现在可以创建单个项目,在项目级别生成API密钥、计费和使用限制。OpenAI正在进行认真的升级,以改善API和开发人员体验。感觉就像在为大事做准备。
- 💰 Mistral AI正在谈判以50亿美元的估值筹集资金。2023年12月,它以20亿美元的估值筹集了4.15亿美元。
🧰 AI新工具
- 1️⃣ Turbologo - 一个在线徽标制作工具,帮助人们在几分钟内创建专业和高质量的徽标(免费)
- 2️⃣ Pseudoface -生成想要保持匿名的内容创作者可以使用的人工面孔(0.99/月)
- 3️⃣ Micro1的GPT vetting -有史以来第一个AI面试官。
- 4️⃣ 3D Generate by Spline - 从文本提示和图像生成3D对象。
0417 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💃 即将举行的选美比赛将首次展示由AI生成的女性参赛者,将角逐13,000美元奖金和“人工智能小姐”的称号。评委中有两名本身就是由AI生成:西班牙的Aitana Lopez和Instagram上的Emily Pellegrini,她们分别拥有超过30万和25万粉丝。
- 🧐 斯坦福HAI发布2024 AI指数报告再解读: 基础模型的发布大幅激增,公布了149种模型 & 每天使用率最高的三个国家是印度、巴基斯坦、肯尼亚。
- 💪 Reka Core - 一个超强的多模态模型,该模型可以理解GPT-4/Claude 3 Opus附近的视频和英寸,特别是在基于视觉的基准中。
- 👨👩👧 Poe上的多机器人聊天,允许您在单个线程中使用不同的人工智能机器人。对于比较不同模型的输出非常有用。您还可以将其与Poe上的自定义机器人相结合,以进行复杂的工作流程。
- ☁️ 谷歌云发布了6个关于如何在谷歌工作区中使用Gemini的简短课程。
- 🔊 Optimizer Al文本到声音模型 1.0 版本升级|AI工具为视频自动生成音效,音质大幅提升。
🧰 AI新工具
- 1️⃣ Voice-Swap - 一个工具,允许制作人、艺术家和作家改变他们的歌声,以匹配排行榜冠军歌手的风格(6.99美元/月)
- 2️⃣ SlangThesaurus - 允许您毫不费力地将基本文本转换为互联网俚语,可定制的俚语级别从1到5(免费)
- 3️⃣ Vidnoz - 一种工具,允许用户只需选择照片并编写脚本即可创建会说话的头像视频(免费)
0416 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💥Adobe发布概念视频,PR整合Sora、Runway、pika,即将重塑AI视频工作流(邀请你共创AI视频)
- 🔢🤖 刘强东的数字人已经上线直播了|把自己数字化就是放大自己IP的影响力,我们AI沃茨也在帮助个人或企业定制数字人👏
- 🤔 OpenAI在开设东京办事处时竞标日本业务
- 🏃 🏃 🏃 🏃 Open AI 发布了批量API,支持异步任务创建。上传一份批量请求文件,就可以在 24 小时获取处理结果,而且费用只有之前的一半。
- 📈 2024 百度 AI 开发者大会 ,文心一言用户突破2亿,API日均调用量超2亿
- 🧙♂️ WizardLM 推出了他们的新模型 WizardLM-2,重要的是他们建了一个完全由人工智能驱动的综合训练系统 💻 来改进WizardLM-2
- 📃 斯坦福大学的 @StanfordHAI 发布了 长达300页 2024 人工智能指数报告!
🧰 AI新工具
- 1️⃣ WisdomAI - 允许用户上传内容以创建由GPT-4提供支持的对话聊天(7美元/月)
- 2️⃣ Hexometer - 一个网站监控工具,可以全天候工作,在问题影响业务之前检测和解决问题(12美元/月)
- 3️⃣ ReplaiGPT - 一个由人工智能驱动的电子邮件回复工具,使用预定义的上下文生成个性化回复(免费)
𝟎𝟒𝟏𝟏 - 𝟎𝟒𝟏𝟓 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🎉 OpenAI为高级ChatGPT用户带来了GPT-4 Turbo的改进版本, 在写作、数学、逻辑推理和编码方面进行了增强,并更新了知识库。
- 🍎 苹果计划使用以人工智能为重点的M4芯片对Mac生产线进行更新
- 🎵 Udio AI:不仅是音乐生成,更是多功能音频引擎,Udio能生成包括喜剧、演讲、广告等,功能远超传统音乐生成模型,表现出广泛的应用潜力
- 👀 马斯克X AI发布Grok-1.5 Vision多模态模型,能力与GPT 4V相当,部分领域更优,真实世界物理空间的理解超过所有竞争模型
- 🏆 Lmsys Arena 聊天机器人竞技场更新|中英文排名更新:GPT-4-Turbo 英文版的第一名,而 Claude Opus夺得中文版的第一名|国产模型Qwen1.5 位列国产模型排名最高
- 📌 Humane的AI Pin评论明显好坏参半:“一半时间都不起作用”
- 🔍 Cohere发布了Rerank 3,以改进企业搜索和RAG系统。
- 💼 OpenAI解雇了两名“涉嫌”泄露信息的研究人员。
🧰 AI新工具
- 1️⃣ Zoviz - 一个由人工智能驱动的品牌平台,允许用户只需点击几下即可创建专业徽标和品牌资产(6美元一次性付款)
- 2️⃣ Rokoko - 各种运动捕捉工具和服务,使用户能够创建更逼真和身临其境的动画(软件每月20美元)
- 3️⃣ 水印去除器-一种使用人工智能技术快速轻松地从图像中去除水印而不影响质量的工具(免费)
0410 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- ❓ 谷歌将Gemini Pro添加到Android Studio中。您可以询问有关开发或使用代码完成的问题。
- 🍎 苹果的Ferret UI-使多模态模型理解用户界面。苹果的研究团队最近一直在积极发布新论文,允许LLM访问和了解您屏幕上的内容。希望WWDC能见到这个新版Siri。
- 👀 OpenAI 发布带有视觉能力的GPT-4-Turbo 128k, 无需使用4v接口
- 🔊 Google宣布Gemini 1.5 Pro开放API新增对原生语音理解能力
- 🎡 Mistral AI 刚刚开源了Mistral 8X22B, 模型文件大小 281.24 GB😂
- 🎵 suno的竞品出现了, udiomusic发布了一段歌曲Demo
- 💦 北大开源Open Sora的ComfyUI工作流,非常简洁,大家可以试起来了
🧰 AI新工具
- 1️⃣ Ankara AI - 一个使用人工智能为视频生成旁白的应用程序(免费)
- 2️⃣ GPTinf - 一种旨在重新措辞AI生成的内容以绕过AI剽窃检测器检测的工具(12美元/月)
- 3️⃣ AlphaCTR - 产品照片的批量编辑器,帮助电子商务企业一次增强多个图像(免费)
- 4️⃣ Morph - 具有生成UI的开源答案引擎。
𝟎𝟒𝟎𝟗 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
长按扫码直接看详细版🎉
🤯AI大事件
- 📼 OpenAI Sora 团队核心成员 Tim Brooks 和 Bill Peebles 带来的《通过模拟一切视频生成将带我们走向通用人工智能,终有一天你可以在视频模型上运行 ChatGPT》视频
- 🔧 Dify支持 AI Workflow,可以基于多种模型和外部工具,编排自己的工作流。
- 🎵 网易云音乐整了一个 Suno AI 音乐的 Tab,汇总了上传到网易云的AI 音乐。
- 🈵 小尺寸的 Llama 3 模型将会在下周推出,不知道有多小 7B 还是 30B。
- 🔢🧑🤝🧑 Digen Al:数字人克隆新选|强大的动态和静态同步能力,支持20种语言
- 🤔 关于Sam Altman和Jony Ive在人工智能设备上工作的谣言一直在上升。感觉这个想法已经从梦想阶段进入了融资阶段。信息报道称,这家新的“神秘”公司希望从Thrive和Emerson那里筹集高达10亿美元。
- 💰 投资者对当前的YC批次有强烈的感受——该批次一半以上的初创公司专注于人工智能。
🧰 AI新工具
- 1️⃣ Banner GPT - 一种为博客文章生成横幅图像的人工智能工具(免费)
- 2️⃣ AliceCam - 一个由人工智能驱动的工具,允许用户创建专业外观的头像,而无需真实照片拍摄(11.99美元一次性付款)
- 3️⃣ CardZap - 一个允许用户创建和共享专业名片的应用程序(免费)
- 4️⃣ Launch Teddy - 旨在为产品发布提供专业支持的人工智能助理(仅供ChatGPT Plus用户使用)
𝟎𝟒𝟎𝟖 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🍮 OpenAl灰度测试Dynamic模式,平衡速度和性能,混合GPT-4和GPT-3.5,根据问题难易使用对应的模型,应该是为进一步放开次数限制做准备。
- 🧰 Octopus-v2:可在移动设备上运行的2B LLM,斯坦福大学Nexa AI开发,比Llama7B + RAG方案快36倍,性能胜过GPT-4。
- 📹 Infinity Al: 一键生成电影的AI工具,仅需输入剧本,即可生成视频,技术仍在开发中。相信在未来10年内,小团队能凭借AI赢得奥斯卡奖。
- 🤖 Zapier联合创始人演示AI自动化工作流,新工作流通过聊天界面创建,易于修改和测试。随着大语言模型能力增强,预见更多软件采用类似交互。
- 🎨 Magnific CEO Javi Lopez 的 365 个生成式 AI 教程挑战:第一个是风格转移,用Midjourney生成线稿后,让 Magnific 风格转绘, 对草图进行着色/纹理/体积化/高清话(4k以上)
🧰 AI新工具
- 1️⃣ Midreal:AI小说生成更新了网页版本, 除了支持生成图片之外,现在网页版的Midreal分享功能也非常好用,分享出去就是一个带插图的完整小说页面
- 2️⃣ IKI:AI RAG驱动的内容收藏, 主要功能有: 自动提取和总结| 自动在聊天和任何现有笔记中显示相关数据
- 3️⃣ Hacker News:完全AI驱动的中文科技播客| 一个完全由AI驱动的中文播客,每天总结Hacker News热门的前十条信息。TTS语音现在是真的自然语言类节目基本不需要人口播了。(超级真实)
- 4️⃣ LocalSearch:开源的完全本地化的AI搜索工具, 无需 OpenAI 或 Google API 密钥。
𝟎𝟒𝟎𝟒-𝟎𝟒𝟎𝟕 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🛠️ OpenAI发布GPT-4的微调工具, 只需 10 个示例就可以有效绕过 GPT4 安全缓解措施
- 🤖 Opera成为第一个内置访问本地人工智能模型的主要浏览器
- 📼 YouTube的首席执行官表示,OpenAI用其视频培训Sora将违反YouTube的服务条款。所以谷歌会对他们进行培训吗?是的,会的,因为这在他们的服务条款中
- 🧰 工具使用 Tool use 允许这些语言模型与外部应用程序进行交互, Anthropic正式宣布了Claude模型的工具用途。现在,Claude模型可用于构建使用其API与Slack、Airtable或Zoom等软件交互的应用程序。
- 🤯 谷歌考虑对人工智能驱动的搜索收取费用,以大幅改变商业模式
- ✍️ OpenAI为ChatGPT添加了图像编辑功能。单击生成的图像,绘制以选择相关区域,并使用新提示符重新生成特定部分。此外,DALL-E的自定义GPT现在有样式建议和选择宽高比的选项。
- 🍿 Stability AI 发布了Stable Audio 2.0-它创建了具有连贯音乐结构的高质量、完整的曲目。从一个提示开始,轨道长达三分钟。在stableaudio.com上试用。
- 🪚 阿里巴巴推出Qwen1.5-32B模型,平衡性能、效率和内存,适用于多语言。强化对话能力,优化内存占用和速度。
🧰 AI新工具
- 1️⃣ Viroll - 一款由人工智能驱动的视频编辑工具,可帮助用户从视频中创建高光剪辑(免费)
- 2️⃣ Fotor - 基于人工智能的一体化工具,用于编辑照片和创建设计(Freemium)
- 3️⃣ Podsqueeze - 一种使用人工智能生成内容的工具,如节目说明、时间戳、时事通讯、推文、博客文章和播客标题(12美元/月)
𝟎𝟒𝟎𝟐 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🔊 微软Azure Al语音服务升级,发布9种更真实的AI语音。对中文支持近乎完美,难以分辨。
- 🔢🤖 MuseV:虚拟人视频的完整解决方案,基于SD,支持文生视频、图生视频、视频生视频,能保持角色一致,不限视频长度。后续会发布MuseTalk来支持实时嘴型同步。
- 🔍 Google DeepMind开发了人工智能系统 SAFE ,可以对ChatGPT等LLM的响应进行事实核查
- 🌟 微软,OpenAI合作1000亿美元的星际之门AI超级计算机项目, 这是5阶段计划的一部分,星际之门是最终第5阶段。
🧰 AI新工具
- 1️⃣ Zyng - 一个允许用户通过上传产品图像(0.05美元/图像)立即创建令人惊叹的产品帖子的平台
- 2️⃣ Teach-O-Matic - 帮助用户从文本说明创建操作视频的工具(开源)
- 3️⃣ Securewoof - 一款人工智能驱动的恶意软件扫描仪,用于检查可执行文件的恶意性(免费)
𝟎𝟒𝟎𝟏 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🎉新版上线,图长按扫码直接看详细版🎉
🤯AI大事件
- 🎉 OpenAI开始取消GPT-4的限制,不限量是成本打到了GPT3.5了嘛|灰度开放中
- 👓 Meta的Ray-Ban智能眼镜将能够使用人工智能看到、听到和说话——下个月上线
- 📱 谷歌将很快在Pixel 8上推出设备上人工智能驱动的功能
- 🔊 OpenAl发布语音生成模型Voice Engine:支持情感丰富的声音生成,多语种和保留口音。
- 📚 微软的生成式 AI 入门课程,十八节课,视频、文本、代码一应俱全
- 🎵 利用CD Baby上传Suno音乐,成功在Tik Tok担任“背景”音乐
🧰 AI新工具
- 1️⃣ Doodle Morph AI - 一个艺术生成器应用程序,将简单的涂鸦变成令人惊叹的、逼真的艺术品(免费)
- 2️⃣ Glasp YouTube Summarizer - 通过ChatGPT Claude运行YouTube视频并总结它们的chrome扩展(免费)
- 3️⃣ Bezi AI - 快速地设计3D应用程序和游戏。
𝟎𝟑𝟐𝟗 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 💲💲 OpenAI正在尝试与其GPT Store 的GPTs们进行基于使用情况的收入分成
- ♻️ ChatGPT新功能预览:允许用户选择用GPT 4或GPT 3.5重新生成结果|支持自由切换模型。
- 😄 X AI 发布了Grok-1.5更新,具有更好的图里能力及 128K 的上下文长度
- 🤖👊 DataBricks宣布了一个名为DBRX的新开源模型。这是一个专家混合模型,培训成本为1000万美元。DBRX击败了Llama 2 70B和Mixtral等其他开放型号,在基准上的表现与Gemini 1.0 Pro和Claude 3 Haiku相似(略优于GPT 3.5)。
- 🍿 Hume AI用EVI震惊了X。EVI是一种具有情商的对话式人工智能。它理解你的语气和情绪,以调整自己的语言和语言。
- 💰 亚马逊加倍购买Anthropic,完成其计划中的40亿美元投资
- 🐰 Rabbit与ElevenLabs合作,在其设备上为语音命令供电。(反应速度慢被解决了?)
🧰 AI新工具
- 1️⃣ AIPhotoeditor - 一款由人工智能驱动的照片编辑工具,允许用户从图像中轻松删除不需要的物体、人物、瑕疵或文本(免费)
- 2️⃣ Cleanvoice - 一种从播客或录音中删除填充声音、背景噪音和嘴巴声音的工具(每月10.79美元 10小时处理音频)
- 3️⃣ HitPaw - 实时人工智能语音转换器,允许用户使用100多种语音更改效果修改语音(3美元/月)
𝟎𝟑𝟐𝟖 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 👋🤖👋 Heygen发布 Avatar in Motion 1.0 新功能|可以保持口型同步,克隆语音语调,保留背景声!还能精准的识别和追踪用户的身体动作,如手部移动和手势!
- 🤯 👆 Make-Your-Anchor:能生成带手部动作的虚拟人。输入1分钟视频进行训练,可以合成带手部动作的虚拟人视频,支持嘴型同步,支持换脸(代码还没发布,不支持克隆语音)
- 💃 腾讯AniPortrait-让照片唱歌说话:支持多种语言、面部重绘、头部姿势控制,|比阿里EMO项目先开源🐶
- 🤖 🏃 埃隆·马斯克说,X上的所有高级订阅者(不仅仅是高级+)本周都将获得AI聊天机器人Grok的访问权限
- 🍎 苹果将在6月10日的开发人员会议WWDC上公布人工智能战略
- 💼 Adobe推出了GenStudio,这是他们基于Firefly的AI图像生成工具的精致版本。它现在可以从现有品牌图像中引用结构。
- 🐰 Rabbit R1的第1批将于4月24日开始交付,快来分享使用体验(真的能取代Iphone吗)
🧰 AI新工具
- 1️⃣ GitMind - 用于想法生成、细化和共享的协作思维导图工具(最多可免费10张思维导图)
- 2️⃣ JungGPT - 一种创新的情感反射反馈(ERF)工具,作为情感洞察力的紧凑型AI伴侣(免费试用)
- 3️⃣ Julius AI + Wolfram Alpha - 解决LLM传统上挣扎的数学方程。
𝟎𝟑𝟐𝟕 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚀 Claude 3 Opus在 7 万人的竞技场投票中超越GPT 4,Claude-3 Haiku 在用户偏好中都达到了GPT-4的水平。最近很多人都叛变投靠了Claude!但这是不是预示着GPT 5要来了
- 🥳麻省理工学院对家庭机器人成功的解决方案,解决方案旨在将“常识”引入家庭机器人错误纠正过程中。
- 🔫 英特尔、谷歌、Arm合作开发开源解决方案,以结束英伟达的人工智能主导地位
- 🍎 苹果将在中国使用百度AI能用于iPhone 16系列,谷歌的Gemin为其他地区的设备提供技术支持
- 🆚 谷歌人工智能黑客马拉松-构建一个使用双子座的创意应用程序,奖金为5万美元。
- ✍️ DALL-E3图像局部重绘:支持对生成图像的选定区域进行修改。引入编辑器增强图像编辑能力。正在灰度测试
- 🎬 LTXStudio电影生成,输入文字提示和创意即可生成电影的产品来了,预计今天发布,整合角色生成,场景指导和换脸
🧰 AI新工具
- 1️⃣ GPT提示工程师-一种使用GPT-4和GPT-3.5-Turbo为特定任务生成和测试提示的工具(免费)
- 2️⃣ Photo2Math - 通过提供分步解决方案来帮助用户解决复杂的数学问题(免费)
- 3️⃣ Twinning -一个社交媒体工具,允许有影响力的人创建自己的人工智能克隆,他们的关注者可以与之聊天(拥有100万+粉丝的影响者免费,拥有10万+粉丝的影响者为299美元)😂
𝟎𝟑𝟐𝟔 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🎉 OpenAI 分享了7段艺术家们用 Sora 制作的短片!Amazing啊!
- 🎬 OpenAI希望好莱坞使用Sora。彭博社报道,首席运营官布拉德·莱特卡普自2月以来一直在洛杉矶安排会议,其中一批会议定于下周举行。有消息说,山姆·奥特曼在奥斯卡颁奖典礼上也巡视了。
- 🎵 如何使用Suno.ai v3用人工智能制作歌曲
- 🔢🤖 HeyGen正在以4.4亿美元的资金前估值筹集6000万美元,由Benchmark牵头。
- 💃 DomoAI上线人物动画功能 | 与AnimateAnyone功能相同,输入人物图片和参考视频,生成人物复刻视频动作的新视频。
- 📚 SAG-AFTRA批准了限制在动画电视节目中使用人工智能声音的合同
🧰 AI新工具
- 1️⃣ ChefGPT - 一个由人工智能驱动的食谱推荐工具,根据您拥有的成分和工具推荐食谱(免费)
- 2️⃣ Chatbit - 一个可定制的人工智能聊天机器人工具,旨在通过回答问题和捕获线索来提高网站参与度(19美元/月)
- 3️⃣ CB Insights的即时洞察-使用人工智能即时生成全面的报告。
𝟎𝟑𝟐𝟓 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🏃 Emad Mostaque 辞去了 Stability AI CEO 的职位,转而追求去中心化的人工智能
- 🎵 Suno 正式发布了他们的 V3 音乐生成模型,现在所有人都可以使用| 音质更佳 & 更丰富的音乐风格和流派选择
- 🤖 Unitree的机器人是第一个在没有液压的情况下进行后空翻的人形(视频)
- 💻 人工智能设备的Linux出现了!Open Interpreter最初是ChatGPT代码解释器的开源实现,现在正加入AI硬件领域。它刚刚发布了O1——一个人工智能设备的开源生态系统。
- 🔊 Character AI刚刚推出了一项名为Character Voice的新功能,可让您用自己的声音与角色聊天!以前,只有付费订阅者才能访问花哨的语音功能。现在,每个人都可以免费使用角色语音。
🧰 AI新工具
- 1️⃣ Bulletin:AI RSS 新闻。 用户可以在阅读所有头条新闻时,通过AI生成的摘要来节省时间,或者在需要深入了解某篇文章时,使用AI生成的全文摘要。
- 2️⃣ Gatekeep:AI可视化学习应用, 旨在简化数学学习过程
- 3️⃣ Teno Chat - 一个智能Discord机器人,旨在加入语音频道,收听和转录会议(免费)
- 4️⃣ SplitSong - 一种人工智能驱动的工具,允许用户将歌曲拆分为单个乐器曲目
𝟎𝟑𝟐𝟐 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🔢🤖 HeyGen发布5.0版本|整合了所有功能,包括全新用户界面设计。引入视频编辑工作室和实时数字人聊天功能。视频翻译等功能全面上线。
- ♟️ Elon Musk的脑芯片初创公司 Neuralink 直播了其第一位患者 Noland Arbaugh,他是一名四肢瘫痪患者,通过Neuralink只用脑袋玩电脑游戏。
- 💻 GitHub最新的人工智能工具可以自动修复代码漏洞
- 🤯 Gemini 1.5 Pro现在在谷歌的AI工作室向所有人开放。它也即将进入API。这是谷歌的模型,上下文长度为1M。
- 👾 月之暗面高管谈kimi的问题,借此进一步了解kimi,以及国内其他“kimi”们的背景故事
- 🔢🤖 SystemAnimatorOnline :基于AI 使用单个网络摄像头的全身运动捕捉方案, 让你能够用自己的身体动作来控制一个虚拟角色,只需要单个网络摄像头或视频文件即可支持全身运动跟踪。
🧰 AI新工具
- 1️⃣ Glarity - 适用于YouTube、谷歌、Twitter和任何网页的开源ChatGPT摘要扩展(12.49美元/月)
- 2️⃣ RizzGPT - 提供一款独特的基于聊天的游戏,专注于与AI角色连接(免费)
- 3️⃣ Langotalk - 通过与AI聊天,帮助人们以6倍的速度学习西班牙语、英语、法语、德语、荷兰语或意大利语
- 4️⃣ Claude 3 提示工程师-创建最佳 Claude 3提示的代理。
𝟬𝟯𝟮𝟭 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 👾苹果发布了新的人工智能模型“MM1”| MM1对图像和文本都进行了培训,使其不仅可以响应文本提示,还可以解决与特定图像相关的复杂问题。
- 🎤Nvidia首席执行官宣布AGI、AI幻觉有望解决| 他提议实施“检索增强生成”战略,人工智能在响应之前根据可靠来源验证答案。交叉引用多个来源,以确保准确性。
- 😂 微软聘请DeepMind联合创始人Mustafa Suleyman担任新人工智能部门的首席执行官
- 🔊 声音效果现在可供Pika Labs的所有用户使用
- 🤩 Claude 3 Haiku & Sonnet现在可以在谷歌云的Vertex AI上使用
- ✍️ Freepik 推出 Reimagine Al工具:用户上传图片自动生成提示词|实时提供无限滚动结果展示,边操作边生成图像。通过调整提示词实时修改图片细节,支持多种风格切换。
- 🤩 FRESCO:转换视频画风|比domoAI好,嵌入了Ebsynth的能力
🧰 AI新工具(AI音乐专题)
- 1️⃣ TuneBlades - 一款人工智能驱动的音乐编辑工具,允许用户将音乐曲目大小调整为任何所需的持续时间(0.99美元/曲目)
- 2️⃣ 和弦ai-使用人工智能技术为任何歌曲提供和弦、节拍和其他音乐信息(免费,每月9美元)
0320 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚨 🤩英伟达公布了人工智能行业迄今为止最强大的芯片| Blackwell AI“超级芯片”,有望比H100提升30倍
- 🤖 Nvidia Project GR00T将GenAI带给人形机器人
- 🎨 Stability AI推出了一种名为稳定视频3D(SV3D)的新模型,更容易、更好地将那些物体的平面照片变成360度视频。
- 📻 Lex Fridman播客上的Sam Altman:AGI、Ilya、GPT-5等
- 🥳 APISR:专门用于提升动漫图片分辨率的模型|4k看龙珠
- 🔢🤖 克隆自己并接入AI替你面试🤯
🧰 AI新工具
- 1️⃣ MLQ APP-基于人工智能的投资研究平台,为股票提供见解和摘要(29美元/月)
- 2️⃣ DrawMyToday-一个使用人工智能根据你的日记条目和情感绘制日常生活图片的应用程序(免费)
- 3️⃣ WriteHuman - 强大的内容重写器,允许用户绕过人工智能检测和跟踪(9美元/月)
- 4️⃣ ReplaiGPT - 一个由人工智能驱动的电子邮件回复工具,使用预定义的上下文生成个性化回复(免费)
0319 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚨 埃隆·马斯克信守诺言,公开从xAI发布了Grok-1。Grok-1是一个大规模(314B参数)专家混合模型。该版本适用于基本模型,Grok-1的性能落后于其他开放的LLM,但这种规模可以通过继续训练开辟有趣的可能性
- 🥳 Kimichat灰度测试200万上下文|目前是支持20万上下文(申请地址)
- 🎉 Magnific发布 Style Transfer 风格转换功能,可以把图片转换成指定画风,效果非常好。需要订阅使用,39美元/月
- ❓ Open-Sora开源项目|完整的文本到视频模型训练过程。|采用优于VideoGPT的VAE模型。|支持DiT、Latte和PixArt的官方权重推理。
- 🆕 高通首次推出以人工智能为重点的骁龙8s第3代芯片
- 📣 OpenRouter:大语言模型“路由器”|提供统一接口访问和使用几十种AI模型。支持GPT、LLama、Claude、Command-R等80多个模型。
- 🎵 《滚石》报道Suno AI与ChatGPT合作创作的歌曲| 模仿独奏原声密西西比三角洲蓝调,讲述一个悲伤的A故事
🧰 AI新工具
- 1️⃣ Quino - 允许用户上传任何文档或研究论文,并生成个性化笔记的工具(6美元/月)
- 2️⃣ Wisecut - 一款使用人工智能和语音识别来编辑视频的自动视频编辑软件(10美元/月)
- 3️⃣ Fathom - 记录、转录、突出显示和总结会议的人工智能会议助理(免费)
- 4️⃣ BigJPG - 允许在不损失质量的情况下放大图像的工具(免费)
0318 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚨 xAI 的 Grok 现已开源! 有史以来最大的开源大模型 -- 314B
- 🎨 Magnific Al的新功能-风格转换: .可以将任意照片转换成各种风格的图像,同时保持人物对象的一致性。
- 👄 Adobe Research推出配音和唇部同步
- 🔢🤖 Argil推出克隆视频功能, 上传你的一段视频,然后只需要上传文字即可生成克隆人视频,类似HeyGen.
- 🚨 🗣️ 微软正在推出更多的 copilots 。Copilot for Security将从4月1日开始提供,Copilot Pro在全球范围内推出,免费试用1个月。
- 🤖 梅赛德斯开始驾驶Apptronik人形机器人| 使用机器人和阿波罗来自动化一些低技能、体力挑战性的体力劳动
- 🍎 苹果收购了初创公司DarwinAI,为其人工智能部门增加了员工。 该公司以使人工智能模型更小、更快而闻名——非常适合在您的设备上直接运行人工智能。
🧰 AI新工具
- 1️⃣ Kin - 个人AI伴侣,旨在在各种情况下为用户提供支持和指导(邀请用户进行beta测试)
- 2️⃣ 人工智能会计师-帮助人们解决税务问题的人工智能会计师(免费)
- 3️⃣ Ugcscripts - 一种人工智能驱动的文案写作工具,为视频生成UGC脚本,允许创作者节省时间并克服创意障碍(9美元/月)
0315 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 📣 Anthropic刚刚在API和网络上提供了 Claude 3 Haiku。Haiku是新Claude 3家族的轻量级冠军(其他是Sonnet和Opus)。它在各个方面都击败了GPT 3.5和Gemini 1.0 Pro| 每百万输入token 0.25美元,每百万输出token 1.25美元。
- 🤔 零一万物大模型开放API接口|1000,000 tokens最低6元。
- 💦 OpenAl Assistants API 支持流处理
- 🥳 谷歌DeepMind的SIMA揭秘:一个受过培训成为您游戏合作伙伴的人工智能代理
- 🤯 A16z的前100名人工智能消费者应用程序。
- 🚀 Starship 第三次飞行测试,SpaceX星际飞船成功发射进入预定轨道,成为有史以来最大的飞行器
- 🖥️ 英伟达发布了黑神话悟空新的DLSS全景光线追踪实机演示。这画面太强了。
🧰 AI新工具
- 1️⃣ 人类与否?-一款社交图灵游戏,允许用户与某人聊天两分钟,以确定是人类同伴还是人工智能(免费)
- 2️⃣ TutorAI - 分享您想要学习的东西的提示,它将为您生成一门课程(免费)
- 3️⃣ YaatriAI - 一个旅行规划平台,根据用户的偏好和预算提供个性化的行程(免费)
0314 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🤖 🤯 机器人 Figure 01 接入ChatGPT 后获得了 视觉环境描述能力、决策推理能力、高层次请求的理解和执行行动的解释能力|遥遥领先
- 🥳 Meta 正在打造一个超大规模的人工智能计算平台 Llama3正在上面训练
- 🎥OpenAI - 首席技术官Mira Murati宣布,该公司先进的AI文本转视频生成器Sora将于今年晚些时候公开推出,并计划最终纳入声音和视频编辑功能。
- 🎉 在抱抱脸上可以执行运行 ComfyUI 了
- 🧠谷歌Deepmind-研究人员创建了SIMA,这是一个可扩展的可指导的多世界代理,能够玩多个3D游戏并根据口头指示行事,通过观察人类游戏进行训练。
- 📣 CNBC报道 欧盟-世界上第一个监管人工智能的全面法案已获批准,按风险水平对人工智能技术进行分类,从不可接受到低风险,并标志着管理人工智能对社会影响的重大全球立法举措
🧰 AI新工具
- 1️⃣ Krizmi - 一个交互式学习平台,提供自动生成的抽认卡和测验,以帮助学生保留和测试他们的知识(免费)
- 2️⃣ 伪面孔-生成想要保持匿名的内容创作者可以使用的人工面孔(0.99/月)
- 3️⃣ Gifshift:Gif2Gif转绘 | 上传一个 GIF ,然后输入你的提示实现转绘!
0313 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚨 OpenAI的 GPT-4.5 Turbo:意外曝光且可能在六月份推出, 首批发现此信息的是Bing和DuckDuck Go等搜索引擎,它们在官方发布之前就索引了这款产品的页面。
- 🥳 Midjourney的角色一致性评测!有抽卡的成分,但是大概率能获得不错的效果,综合效果比SD好。
- 🤯 Google新论文介绍了一种模型窃取攻击方法 ,并已经成功攻破ChatGPT|仅需不到20美元,就能攻击并提取出OpenAI的ada和babbage语言模型的整个投影矩阵。
- 🤖 Command-R:专为RAG优化的LLM| Cohere开源的35B模型,128K上下文,为RAG专门做了优化,在RAG能力上超越了GPT-3.5。
- 📣 OpenAI发布了一个 Transformer Debugger -OpenAI的超级对齐团队一直在内部使用它来分析变压器的可解释性。
🧰 AI新工具
- 1️⃣ Dr. Lambda - 允许用户将PDF、网页和YouTube内容转换为专业和交互式幻灯片(9.9美元/月)
- 2️⃣ Shiken - 一款结合了人工智能辅导、测验、正念和游戏设计的学习应用程序,帮助学习者更长时间地保留信息(10美元/月)
- 3️⃣ Repo to Text(对于LLM)-将您的repo转换为优化的文本文件,以将其发送到LLM
0312 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚨 🥳Musk的xAI本周将开源Grok| 在宣布这一消息之前,Musk最近对OpenAI采取了法律行动,指责该组织从最初的非营利性使命转向营利性模式。
- 🎉 Midjourney的角色一致性终于发布了
- 🤯 Midjourney 指责 Stability AI 盗用图像,并禁止所有Stable Diffusion开发人员使用其服务
- 🤖 英伟达因涉嫌使用来自“影子图书馆”的受版权保护的书籍来培训其NeMo AI平台而面临诉讼
- ❓ Claude 3推出提示词优化器,可以优化提示词。需要Claude API,输入简短提示词能优化成非常完备的提示词
- 🔊 OpenAI Sora团队三巨头做客 Marques Brownlee 播客| 透露了一些关于Sora的架构、训练、Sora的目标、目前存在的问题、未来畅想,以及要给Sora视频添加AI水印等安全问题。‼️ 核心信息是短时间内Sora不会向公众开放...
🧰 AI新工具
- 1️⃣ Humata - 一个工具,提供快速总结长篇论文并获得即时答案的简单方法
- 2️⃣ moot app - 允许用户不受限制地在任何网站或链接上分享他们的想法和意见。
- 3️⃣ AI/ML API - 通过1个API访问100多个AI模型
0311 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🚨 在模拟现实世界用例的新基准中,Claude Opus略低于GPT-4。
- 🤯 ChatGPT现在具有多因素身份验证。它还正在为免费用户尝试新的“升级响应”功能。它显示了GPT-4生成的响应
- ❓ OpenAI的戏剧还没有结束。《纽约时报》声称米拉·穆拉蒂在山姆被赶下台之前对他的管理风格有一些疑问。米拉给员工发了一条信息,拒绝透露任何她想要山姆出去的迹象。
- 🤖 Inflection AI的聊天机器人Pi每日活跃用户超过100万
- 🔊 继唇形同步后,Pika推出音效功能,很大概率是用11labs的服务
- 🔊 YT节目推荐: Mikey Shulman:Suno和人工智能音乐之声
🧰 AI新工具
- 1️⃣ MakeShorts - 一个由人工智能驱动的工具,允许用户将YouTube视频转换为短剪辑
- 2️⃣ AliceCam - 一个由人工智能驱动的工具,允许用户创建专业外观的头像,而无需真实照片拍摄
- 3️⃣ Glimmer - 以搜索引擎的形式搜索大量的PDF
0308 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🆚 LLM竞争白热化 !!Pi 升级,现在由最新的LLM:Inflection-2.5提供支持,据说是用了40%的算力资源就达到了gpt4级别
- 🚨微软工程师对Copilot Designer安全问题发出警报
- 🌍 高管表示,Meta正在构建一个巨大的人工智能模型,为其“整个视频生态系统”提供动力
- 🤯 前谷歌工程师被指控为中国公司窃取人工智能机密
- ❓ AI.com现在属于谷歌。它从OpenAI到Musk,现在又到谷歌
- 🤖 Qwen-Agent:基于通义干问的Agent开发框架| 千问官方提供的Agent开发框架,可以实现指令遵循、工具使用、规划、记忆能力。
- 🔊 MyShell 开源了号称目前全世界效果最好的 TTS 库 MeloTTS| 目前 MeloTTS 支持英语、西班牙语、法语、中文、日语和韩语, 支持中英混杂
🧰 AI新工具
- 1️⃣ Any Summary -一个由人工智能驱动的工具,可以快速总结长时间的采访音频或视频文件(免费)
- 2️⃣ Civitai - 一个在线平台,让人们可以轻松分享和发现创建人工智能艺术的资源
- 3️⃣ Lummi - 由人工智能艺术家制作和策划的免费图片库
0307 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🤖 🆚 🤖 OpenAI回应ElonMusk起诉,公开他们来往邮件| Elon早在OpenAI开始时就参与其中,但现在却起诉OpenAI
- 👄 Lip Sync现在向Pika Labs的所有人开放。
- 💡 Anthropic的 Alignment Researcher 对 Claude 3 的系统提示进行了分解。它比ChatGPT的版本短得多。
- 🎨 Stability AI和 Tripo AI 的 TripoSR 从单个图像创建3D对象。
- 📹 📼 随着DeepMind校友揭开视频生成工具 Haiper的面纱,人工智能视频生成的竞争升温
- 👨🔬新闻-根据以色列研究人员团队进行的一项研究,ChatGPT等人工智能聊天机器人可能比人类医生更擅长遵循抑郁症治疗标准
- 🐦⬛ Yi-9B:零一万物的强化版小模型|之前的是6B模型,9B模型在数学和代码能力上更强,支持中英双语
🧰 AI新工具🏎️
- 1️⃣ 安卡拉人工智能-一个使用人工智能为视频生成旁白的应用程序(免费)
- 2️⃣ 伪面孔-生成想要保持匿名的内容创作者可以使用的人工面孔(0.99/月)
- 3️⃣ Face26 - 一键帮助改善、增强和修复照片质量(72美元/年)
0306 𝓐𝓲𝓦𝓪𝓻𝓽𝓼 𝓝𝓮𝔀𝓼 🧙 📰
🤯AI大事件
- 🤖 🆚 🤖 就在埃隆·马斯克起诉该公司将利润置于人之前几天后,OpenAI签署了负责任地构建人工智能的公开信
- 💔 继谷歌后,Meta的人工智能 Imagine 被指控创造了历史上不准确的图像
- 💰 Anthropic投下一颗炸弹——Claude 3可能是新的人工智能之王。
- ✍️ Stabile Diffusion 3 的研究论文| Transformer+Diffusion结合的模型,后续会开源
- 🎫 在技术主导地位、芯片短缺的情况下,中国促进了人工智能初创企业的公平竞争, 包括上海在内的17个市政府已承诺提供“计算券”,以帮助因关键芯片短缺而面临数据中心成本上升的人工智能初创公司。
- 🔢🧑🤝🧑 D-ID Agent-创建和部署可交互的数字人员|价格有点感人
- 🆓 免费领取Groq API|Groq是专门用于LLM推理的芯片,在官网可以免费创建APIkey,输出比你的输入还快。
- 📹 CopyCopter:一键把文章变成短视频| 输入文章地址,自动提炼文章内容,自动使用题材相关的素材生成带语音、带字幕的视频。|输入的文章可以是中文,生成的视频是英文的。(TikTok走起)
🧰 AI新工具
- 1️⃣ Teno Chat - 一个智能Discord机器人,旨在加入语音频道,收听和转录会议(免费)
- 2️⃣ Pezzo AI - 一个开源平台,允许用户高效地构建、测试、监控和部署人工智能模型(免费)
- 3️⃣ My Ask AI - 让AI回答75%的客户邮件
03月04号
🤯AI大事件
- 🤖 机器人初创公司 Figure 从微软、英伟达、OpenAI筹集了6.75亿美元
- ☁️ 谷歌云与 Stack Overflow 链接,使用Gemini提供编码建议
- 📣 埃隆·马斯克 (Elon Musk) 对 OpenAI 及萨姆·奥特曼 (Sam Altman) 提起诉讼,指控他们违背了 OpenAI 成立之初的协议 —— 保持为一个非盈利机构。埃隆声称,他们目前采取的是闭源方式,并与微软合作进行盈利。
- 💰 Microsoft Copilot for Finance(金融版本) 现在已经开放!
- 🐦 Sora最新视频|外星人👽 & ✈️飞机穿越博物馆 & 纳米和铁磁流体的未来餐厅 & 微距地球🤯
- 🤔 北京大学YuanGroup团队发起Open-Sora计划, 结合视频VQ-VAE、Denoising Diffusion Transformer等技术
- 🔊 ChatGPT语音朗读功能开始灰度测试
🧰 AI新工具
- 1️⃣ WriteHuman - 强大的内容重写器,允许用户绕过人工智能检测和跟踪
- 2️⃣ FinetuneDB - 无代码LLM操作平台
- 3️⃣ SciPhi的R2R-为生产就绪的RAG系统开发和部署框架。
🌍 AI世界动态
- 🐕🦺人工智能如何帮助人类与动物交谈| 特拉维夫大学的研究人员通过人工智能开发了一种解码蝙蝠声乐通信的新方法
- ⚡哈利·波特帮助研究人员训练GenAI模型| 微软撰写了一篇题为《谁是哈利·波特?》的论文。展示一种大型语言模型有选择地忘记信息的技术
03月01号
🤯AI大事件
- 🎬 LTX Studio:由AI驱动的一键生成电影|只需要输入简单的文字和创意,它就能帮你生成完整的剧本|同时将剧本直接转化为视频
- 🎵 Adobe宣布推出用于创建和编辑音乐的新人工智能工具
- ✍️ ldeogram 推出1.0版本|能在图片里写字| 目前能写字的模型:Ideogram、Dall E 3、Stable Cascade
- 🎨 DALL E的GPTs支持选择画风和比例|灰度测试中
- 🍎 首席执行官蒂姆·库克表示,苹果将在今年晚些时候披露人工智能计划
- 🦙 Meta计划在7月发布“更松”的 Llama 3
- 📣 DeepLearning.Al X META 推出 Llama 2的提示工程短期课程
🧰 AI新工具
- 1️⃣ Taption - 一个由人工智能驱动的平台,为音频和视频内容提供自动转录、翻译和字幕服务
- 2️⃣ Fantoons - 允许用户根据《哈利·波特》宇宙中的流行角色创建粉丝漫画和故事的工具(免费)
- 3️⃣ Readshark - 一个基于订阅的平台,为忙碌的专业人士提供全面的书籍摘要库
- 🎉 Cursor中的Copilot++:根据您的活动编辑代码建议。
2月29号
🤯AI大事件
- 😂 阿里巴巴发布 EMO :一张照片+音频即可生成会说话唱歌RAP 的视频(图生数字人)
- 👄 Pika Labs的专业用户现在可以提前访问Lip Sync唇形同步| wav2lip 最近也在优化,facefusion 换脸工具加入了 lip-sync|会不会是 Sora 只能做无声视频,让各大做AI 视频生成公司做音频差异化!
- 🧑🤝🧑 Wonder Studio更新!支持导出2D视频背景、3D角色、相机、光源,可以继续在虚幻引擎中编辑(数字人平台一股清流)
- 🎉 Pi by Inflection AI现在可以作为桌面应用程序(Windows和Mac)使用。
- 🐶 AI和Arc Institute共同创建了Evo——一个生物学的基础模型,可以将小分子创建为长基因组。与语言模型中的长语境类似,在长语境(基因组尺度)中理解小变化(单核苷酸)的能力使其变得有用。模型权重和数据集是开源的。
🧰 AI新工具
- 🆚 Competely - 一款由人工智能驱动的竞争分析工具,可帮助用户快速收集有关竞争对手的信息
- 🧑🎨 小艺术家-一个由人工智能驱动的工具,可将儿童绘画转换为专业水平的艺术品
- 🐶 Pic A Pet Name - 一个在线平台,帮助宠物主人为他们的宠物找到完美的名字(所以大黄算好名字的,对吧)
🌍 AI世界动态
- 😈 用户激活Copilot AI的邪恶自我!Copilot已经开始要求用户崇拜它。
- 🤯 Tumblr和WordPress的所有者Automattic正在与人工智能公司Midjourney和OpenAI讨论,以提供从用户帖子中获得的培训数据。
- 🤔 人工智能民主项目和非营利媒体Proof News最近进行的一项研究表明,流行的人工智能聊天机器人无法获得选举相关信息。
- 🚗 苹果扼杀了其电动汽车项目,转而支持人工智能
- 🔪 OpenAI的法院提起诉讼,声称《纽约时报》“黑客入侵”了OpenAI的系统。
2月28号
🤯AI大事件
- ✍️ Playground AI发布绘图模型Playground v2.5|基于扩散模型,用户偏好评分超过SDXL、DALL·E 3、Midjourney v5.2
- 👄 Pika推出嘴型同步功能,由ElevenLabs的技术实现的
- 🤖🤯 机器人Ameca更新, 具有了视觉能力|能模仿名人说话,更赛博了
- ♻️ DomoAI 推出 fusion style 功能|只需要通过简单的提示词就能改变视频的风格|还能给视频中的人物增加/替换小物品,甚至换衣服
🧰 AI新工具
- 📚 SlidesPilot - 一款由人工智能驱动的工具,可帮助用户快速轻松地创建PowerPoint演示文稿
- 😊 Misgif - 一个由人工智能驱动的工具,允许用户使用一张自拍将自己放入他们最喜欢的GIF中
- 😺 ChatGitHub(GPT4支持) - 一个有用的信息助手,旨在回答有关GitHub的问题
🌍 AI世界动态
- 🚀 阿里巴巴在生成人工智能上以数十亿美元的赌注支持Moonshot AI
- 💰 微软在Mistral AI的投资为1600万美元
2月27日
🤯AI大事件
- 🤯 Mistral Large 现已发布:能力介于GPT-4和 Claude2之间|32K Token 上下文窗口|多语言支持|支持函数调用|在Azure Al Studio上可用
- 🚀 Groq首席执行官声称,到2024年底,大多数初创公司将使用快速的LPU
- 🎮 谷歌发布Genie: 能生成横版跳跃游戏的视频模型通过文本、图像可以生成类似超级玛丽的横版游戏视频
- 👄 VSP-LLM: 基于AV-HuBERT模型将视频中唇动转化为文本,实现视觉语音识别和翻译。
- 🥣 Sora完整能力曝光: 生成、编辑、识别、处理、理解视频和图像内容 | 展现出与Gemini 1.5 Pro相似的视频理解能力
🧰 AI新工具
- 💼 Tripmix - 人工智能旅行规划师,根据个人喜好制作个性化旅行
- 🫘 Comicai - 一个由人工智能驱动的工具,允许用户轻松创建漫画
- 🎵 Discover Daily -由Perplexity和ElevenLabs提供的播客,涵盖技术、科学和文化
- ✍️ Hyperwrite AI的Agent Studio-只需自己完成一次任务,AI就可以重复它
2月26日
🤯AI大事件
- Phind-70B创建GPT-4 Turbo质量代码,同时运行速度快4倍。
- Stability AI推出图片增强工具:Creative Upscaler | Alpha测试阶段,仅限付费用户使用,功能与Magnific类似。
- OpenAI即将关闭ChatGPT插件功能: 猜测是因为与GPTs功能重合,以后只让用户使用GPTs。 3月19日起,用户将无法再安装新插件或使用现有插件创建新对话;现有对话可以继续到 2024年4月9日。
- Sora简易版本体验:通过关键词生成视频: 人物、着装、天气、地理位置, 提供不同组合生成视频(来源OpenAI技术报告)
🧰 AI新工具
- Adori Labs - 一个帮助博主使用人工智能将书面内容转换为引人入胜的视频的平台
- Verbalate - 一款视频翻译和唇部同步软件,旨在帮助企业接触全球受众
🌍 AI世界动态
- Reddit与谷歌达成了6000万美元的交易,出售用于人工智能培训的数据 & Reddit将使用Vertex AI来增强Reddit搜索
- 谷歌Gemini推出了一个新的Chrome扩展程序,帮助您更快地编写无聊的东西
- 《路人的回忆I》 Memories of Passersby I 是德国艺术家Mario Klingemann的开创性人工智能创作品。 这件艺术品于2019年在苏富比以4万英镑的价格出售,使其成为第一件在大型拍卖会上出售的人工智能艺术品。
- Audioshake、ElevenLabs和PrometheanAI成为了2024年迪士尼 AI 的一部分。
2月23日
🤯 AI大事件
- 📹 Stable Video官网上线:图片和文字提示生成高质量视频。日赠150积分
- ✂️ 剪影海外版CapCut新功能:支持中文文本生成视频,支持多种比例。
- ✍️ Stability AI发布 Stable Diffusion 3,基于Transformer架构,对提示词的理解和图片质量均有提升,尤其擅长在图里写字
- 🗡️ Gemma: 谷歌的开源模型体验地址:HuggingChat & Perplexity
- 🦙 🦙 🦙 🦙 🦙 🦙 LongRoPE:扩展LLM的上下文长度到200万 微软推出的方法,不影响性能,通过微调的方式,扩展LLM上下文到200万Token,属于是超级加倍了
- ⏸️谷歌暂停了双子座生成图像的能力,原因是模型创建了不准确的历史图片
- 🚀 独家:Reddit与谷歌达成AI内容许可协议
- ⚙️ Google DeepMind成立了一个专注于人工智能安全的新组织。
- 🧑🤝🧑 HeyGen 商业化案例: WiseTech Global 使用HeyGen制作了其1H24业绩简报的多语言视频,包括英语、法语、德语、西班牙语、中文, 全长27分钟...除了英语其他都是AI生成,口型对应很完美
🧰 AI新工具
- 👀 借口生成器-一个有趣的工具,为各种情况提供借口,可以调整专业精神或幽默
- 🫧 Droppedhub - 一个根据关键词分析和市场差异化来策划和排名过期域名列表的平台
- 🤖 NotesLlama - 在Apple Notes中与当地LLM交谈
2月22日
🤯AI大事件
- 谷歌发布开源模型Gemma🔥🚀 与Gemini使用相同的技术|有2B和7B两个版本|又是开源最佳
- 微软确认 Copilot 将整合 Sora
- Gemini Advanced现在可以运行Python代码,而无需复制粘贴到Colab或您的IDE中。您还可以在Gemini的沙盒中编辑代码。
- Adobe推出可以搜索和汇总PDF的人工智能助手
- 威尔·史密斯模仿AI生成的意大利面视频爆火
- Llamaindex正在推出两项新功能:LlamaCloud - 管理解析、摄取和检索服务,以构建生产级应用程序。LlamaParse - 带有嵌入式表格和图形的复杂文档的最先进的解析。
- AI x生产力工具-a16z的市场地图。
- Open AI传奇研究员Andrej Karpathy的新课,教你理解和构建GPT Tokenizer
🧰 AI新工具
- TwGPT - 一个开源浏览器扩展,使用人工智能帮助Twitter用户更有效地回复推文
- Dr. Lambda - 允许用户将PDF、网页和YouTube内容转换为专业和交互式幻灯
- Gigabrain - 搜索真人答案,来源Reddit和其他在线社区的答案
🌍 AI世界动态
- 剑桥大学建议设置人工智能杀死开关,以防止类似天网的场景。通过添加称为协处理器的额外组件来对人工智能芯片进行更改。
- 微软开发人工智能服务器设备,以减少对英伟达的依赖
2月21日
🤯AI大事件
- 🤖Groq AI;模型做高铁,一秒500tokens。ChatGPT和Grok的新挑战者
- 🔍 生成性人工智能聊天机器人将在未来两年内将搜索引擎使用量减少25%( Gartner报告 )
- 🍿 在预览了其视频生成模型后,OpenAI正在推出自己的社区版本——OpenAI论坛。但这个新论坛不仅仅是一个社区,它是OpenAI试图与专家、评论员和用户直接联系的平台
- 📚GPT-4-Turbo的知识截止现在是2023年12月
- 🎨🤖 X + Midjourney会谈正在进行中,目标是建立伙伴关系。
- 📷 OpenAI下场玩短视频了!Sora开始发力
🧰 AI新工具
- Imagetocaption - 一款由人工智能驱动的工具,可自动为社交媒体图像生成SEO优化的字幕
- Hovercode - 一种允许用户创建和管理可跟踪和可编辑二维码的工具
- TimeToTok - 一个由人工智能驱动的工具,提供见解和建议,帮助抖音创作者发展他们的帐户
- AINiro - 一个人工智能聊天机器人平台,为各种目的提供定制的ChatGPT聊天机器人,如客户服务、电子商务和潜在客户生成
🌍 AI世界动态
- Nvidia将“Attention is All You Need”论文的所有作者聚集在一起,与Jensen Huang会面(这是要搞大事啊)
- 中国初创公司Moonshot AI筹集了超过10亿美元
2月20号
🤯AI大事件
- ElevenLabs的AI音效,给Sora加上声音!申请链接🔗
- DomoAI视频到视频2.0-为您的视频制作动画,现在能采用吉卜力风格。
- Large World Model:100万上下文的多模态开源模型。像Gemini 1.5一样,上下文长度100万token,一次可以分析1小时长度的视频。
- Sora中文报告简化版!中学生能看懂。
- 申请OpenAI红队有几率获得Sora使用资格!
🧰 AI新工具
- Watermark Remover -一种使用人工智能技术快速轻松地从图像中去除水印而不影响质量的工具(免费)
- CoverLetterWrite - 帮助用户撰写个性化求职信(免费)
🌍 AI世界动态
- Reddit签署协议,为人工智能培训出售用户内容
- OpenAI估值为800亿美元的筹款交易似乎已经完成。自11月下旬Sam Altman被解雇以来,这笔交易一直处于悬而未决状态
2月19号
🤯AI大事件
- Prompt新技巧!Self-Discover:比CoT更有效的推理方法: 针对不同的问题,先用各种思考方法,例如批判性思维、逐步思考等,组合成适用于这个问题的推理结构,然后再用这个结构来推理。效果比CoT好32%
- Mistral 在 LLM 竞技场悄然发布了 Mistral-Next 模型, 中文能力更好
- 模型训练技巧:Dora - 比LoRA更好的微调方法
- Sora技术展示一多视角视频生成, 不需要人工编辑的情况下,自主决定展示多个视角
- Open AI 取消了 GPT-4 Turbo 的每日调用限制并将总的调用限制提高了一倍
🧰 AI新工具
- Ollama Windows 预览版推出
- Chat with RTX:英伟达的本地LLM聊天程序。 使用 RAG 和 TensorRT-LLM 在 RTX 加速的 PC 上本地进行聊天。
- MetaSo:针对中国用户的A搜索产品, 提供问题答案、大纲、思维导图、时间线和信息来源。
2月17号
🤯 AI大事件
- 🔥 OpenAI新文本到视频人工智能模型 Sora 火遍全网,只需提供文本提示,即可制作长达一分钟的逼真视频。作为“世界模型”,Sora了解现实世界中事物是如何运作的,这使得它能够准确地代表道具,并创造具有情感表现力的人物。
- Sora的图像生成能力优于Dalle3,不及Midjourney
- OpenAI视频模型Sora完整技术报告(中英文)
- V-Jepa by Meta - 一种新的人工智能模型,通过观看视频了解世界。
- 🤩 谷歌推出的Gemini 1.5 Pro,旨在取代Gemini 1.0 Pro。Gemini 1.5 Pro的最大上下文窗口为100万个令牌,超过了OpenAI的GPT-4,它有128,000个令牌限制。
- 谷歌宣布了一系列免费的人工智能网络工具,以帮助组织提高在线安全
- 谷歌悄悄地推出了Goose: 一个内部人工智能模型,以帮助员工更快地编写代码。
- 苹果正在为Xcode开发 copilot ,这是软件编程工具。
- LangChain 的 LLM 应用开发平台LangSmith正式开放给了所有人使用,同时宣布获得了Sequoia 领投的 A 轮融资 💰
🧰 AI新工具
- Blackbox: 允许用户从视频、图像、PDF和其他格式中复制代码
- FotoFix: 一个由人工智能驱动的工具,可以修复旧的和模糊的图像或增强新的图像
- AI婴儿生成器: 根据父母的照片和身体特征生成逼真的婴儿照片
2月16号(新年快乐!恢复更新!超大杯!🥤)
🤯 AI大事件
- 1️⃣ OpenAI发布全新文本生成视频大模型Sora,主要特点:“60s超长长度”、“单视频多角度镜头”和“世界模型”
- 2️⃣ 谷歌宣布发布Gemini 1.5 Pro,最高支持1000万上下文长度,GSM8K评测全球第一
- 3️⃣ 谷歌将Bard AI更名为Gemini,推出新应用程序和付费订阅,对于现有的Google One订阅者,19.99美元的费用包括他们现有的存储计划
- 4️⃣ OpenAI的Sam Altman寻求数万亿美元为人工智能芯片提供资金
- 5️⃣ OpenAI引入了新的内存控件,允许用户提示ChatGPT忘记或记住未来对话的特定信息, 如记住你喜欢你的博客文章以及你使用什么编程语言。GPTs也将拥有记忆功能。
- 6️⃣ Stability AI 发布了新的AI模型, Stable Cascade: 引入“三阶段方法”提升图片生成质量与灵活性。训练成本比SD模型低16倍。
- 7️⃣ ElevenLabs宣布了配音演员支付计划。推销很简单:生成你的声音克隆,并在人们使用它时获得报酬。
- 8️⃣ Aya by Cohere - 由3000多名研究人员构建的101种语言的多语言人工智能。
- 9️⃣ FaceFusion 2.3.0:高精度面部识别技术更新-68点面部标记模型提升口型同步效果。优化算法处理面部边缘。68点转5点简化模型,提高面部识别效率。
🧰 AI新工具
- Kaedim -用户能够从2D图像生成高清3D模型
- AIHairStyles - 一个发型生成器,允许用户通过上传自拍来发现新发型
- Gummy Search - 允许用户在Reddit上查找、组织和搜索社区
- Avaturn - 允许开发人员为他们的元宇宙、游戏或应用程序创建逼真和可定制的3D头像
- Insight Monk-提供1000多份涵盖各行业的深度技术市场研究报告
- Thing Translator -允许用户使用手机的相机将物理对象从一种语言翻译成另一种语言
- MagicSchool.ai - 旨在协助教育工作者完成各种任务,如课程规划、差异化教学
- Audioatlas - 允许用户从超过2亿首歌曲的庞大全球数据库中找到最合适的音乐
- Frontdoor - 帮助用户从网络捕获和组织信息的人工智能知识助理
- GrapeGPT - 通过根据用户的口味偏好提供个性化建议,帮助用户选择完美的葡萄酒
- Headshot Pro - 专业AI商业头像
- NotesGPT - 将您的语音笔记转换为有组织的摘要和清晰的行动项目。
- MoneyPrinter: 自动化YouTube短视频赚钱项目: 自动视频生成,音乐和字体自定义。|利用MoviePy和YouTube API实现视频自动上传
🌍 AI世界动态
- 1️⃣ 白宫将“加密验证”乔·拜登的视频,这样观众就不会把它们误认为是深度伪造
- 2️⃣ 联邦通信委员会禁止在未经请求的机器人电话中发出人工智能声音
- 3️⃣ 百度与联想合作进行第三笔中国人工智能智能手机交易
- 4️⃣ 美国专利商标局澄清了关于人工智能辅助发明的政策: 个人只有在为人工智能辅助发明做出重大贡献的情况下才能获得专利。
- 5️⃣ OpenAI在作者的美国版权诉讼中部分获胜
- 6️⃣ 谷歌的人工智能将绘制来自太空的甲烷泄漏图: MethaneSAT将创建一个全面的全球石油和天然气基础设施地图,确定容易泄漏的位置,如泵千斤顶和储罐。
- 7️⃣ 谷歌将在法国建立新的人工智能中心
- 8️⃣ OpenAI有望达到20亿美元的年化收入。OpenAI着眼于在2025年将此增加一倍。
- 9️⃣ NVIDIA 成为全球市值第四大公司
- 🔟 马斯克宣布将用「X」取代手机电话。计划注销电话号码,使用「X」进行信息收发和通话。
2月7号
🤯AI大事件
- MidJourney 聘请了一名来自 Apple Vision Pro 的硬件工程师担任“硬件主管”,大概率为AR/VR 生成完整的合成世界作准备
- 404 Media的Joseph Cox在OnlyFake上在几分钟内制作了2个假ID,并使用其中一个成功绕过了身份验证检查
- Image to Music V2:将上传的图片自动转化成音乐(来听听用gpt logo能做出什么)
- 2023年度算力报告| Meta的GPU数量一骑绝尘
🧰 AI新工具
- Unscreen -从视频和GIF中删除背景的工具
- ChatBacklinkBot - 一个由人工智能驱动的工具,帮助用户发现反向链接,从网页中提取关键字
- GPT Prompt Engineer -一个使用GPT-4和GPT-3.5-Turbo为特定任务生成和测试提示的工具
🌍 AI世界动态
2月6号
🤯AI大事件
- 巴德正在更名为 Gemini + Gemini Advanced(对外说成为GPT-4杀手)将于2月7日(本周三)推出。 😏
- 通义千问发布 Qwen1.5 版本,72B在评估上超越了 Claude-2.1、GPT-3.5-Turbo-0613
- AI春联在线生成器体验🔥: 用户可生成个性化春联
🧰 AI新工具
- Docu.review - 一个由人工智能驱动的合同审查工具,将复杂的法律语言简化为简单的英语
- VideoMyListing - 一个由人工智能驱动的工具,可以创建引人入胜的视频,在Airbnb、Etsy等各种平台上推广列表
- LlamaBot for Discord - 让大模型收听您的discord频道,回答您的问题。
🌍 AI世界动态
- 如果无法达成人工智能协议,英国艺术工会“准备”罢工
- 一加在其旗舰手机中增加了人工智能功能
- 一家跨国公司的香港分公司损失了2560万美元,使用深度伪造技术的骗子在视频电话会议上冒称该公司的首席财务官(CFO)并下令转账
2月5号
🤯AI大事件
- 苹果公司开放了 MGIE 的源代码!现在可以随意用 iPhone 拍摄照片,并通过文字P图了!
- StabilityAI 发布 Stable Video Diffusion 1.1 版本, 改进生成性能,提供流畅高质量视觉体验
- HeyGen AI 实时视频聊天功能上线!与HeyGen CEO的AI分身进行实时视频聊天。
- iFixit发布Apple Vision Pro拆解视频| iFixit发布Apple Vision Pro拆解视频
🧰 AI新工具
- 🍽️ MyFoodPlanet - 用您自己的个人人工智能创建令人愉快的食谱
- 🎯 Agentic - 使用人工智能创建高质量的SEO内容。
- 🎭 InterAIct - 与人工智能角色进行实时对话。
- 😂 Punchlines AI - 与你的人工智能喜剧伙伴一起制作笑话。
- 🤖人工智能照片向导-使用人工智能创建和编辑图像。
2月4号(工作日周日不停更)
🤯AI大事件
- 🍿 亚马逊发布了 人工智能助理 Rufus。它基于来自零售店的独特数据,它挖掘客户评论、问答和网络,以准确找到您需要的东西。
- 💰 微软刚刚推出了Copilot for Sales and Service,将人工智能整合到销售和客户服务专业人士的日常工作中。这两个都是每个用户每月50美元。
- OLMo - Allen人工智能研究所的7B基本模型。带有代码和数据的全开源模型
🧰 AI新工具
- 🎁Botsy Gifts - 人工智能礼品助理,帮助用户根据所爱的人的社交媒体帐户找到礼品创意
- 🤖 Wirestock AI - 一个允许用户直接在Discord上生成、升级和销售AI图像的机器人
- 📚 Anki卡生成器-使用AI创建Anki卡!
🌍 AI世界动态
- 🤓Meta开发定制AI芯片, 被称为“Artemis”的新芯片将只专注于推理过程。
- 🎉 蒂姆·库克证实,苹果的生成性人工智能功能将“今年晚些时候”推出
- 麦肯锡高级合伙人 RodneyZemmel 的演讲,讨论了AI对人才战略的影响,以及企业在实施AI时需要考虑的因素。
2月2号
🤯 AI大事件
- 特斯拉机器人擎天柱陪伴埃隆·马斯克“散步”
- 微软、OpenAI正在谈判为人工智能的人形机器人提供资金
- Mistral确认了新的开源人工智能模型接近GPT-4性能。以下是发生的事情:
- 一位匿名用户在HuggingFace上发布了文件,其中包括一个名为“miqu-1-70b”的新开源大型语言模型,该模型显示了接近GPT-4的性能。
- Mistral的首席执行官后来证实,是员工泄露的旧Mistral模型的量化版本。
- 谷歌Bard更新:支持更多语言,支持生成图片,由新模型Imagen2支持
🧰 AI新工具
- 👍 ElevenLabs 推出GPT - 用逼真的声音将朗读提示
- Happyml - 一个允许用户创建、教育和部署具有可自定义提示、外观、色调和操作的聊天机器人的工具
- Human or Not? -一个图灵测试游戏,用户聊天两分钟,以确定他们是在与人工智能机器人还是人类交谈
🌍 AI世界动态
- 📳美国联邦通信委员会提议将人工智能机器人电话定为非法
- ✍🏻英国和加拿大签署人工智能协议
2月1号
🤯 AI大事件
- ChatGPT即将发布 Data Analysis V2 版本,支持上传Excel和json文件。
- 阿里发布 Qwen-VL-Plus 和 Qwen-VL-Max, 官方称中文图片理解能力甚至超越GPT-4V和 Gemini。
🧰 AI新工具
- Wonderplan - 一个由人工智能驱动的旅行规划师,根据您的兴趣、偏好和预算生成量身定制的旅行行程
- Synclabs - 将任何视频翻译成任何语言,具有完美匹配的唇部动作。
🌍 AI世界动态
- 🚫韩国禁止深度伪造视频
- 🤖 机器人被训练以人类两倍的速度阅读盲文
- 《纽约时报》正在建立一个人工智能团队,但不是为了诉讼,而是探索人工智能如何让他们的新闻编辑室充满活力。
- The Information的AI芯片数据库-18家公司正在挑战Nvidia。
1月31号
🤯 AI大事件
- 🧠第一个接受Neuralink大脑植入物的人: Elon Musk的Neuralink成功地将其大脑芯片植入了第一位人类患者。【脑机接口真成事实了】
- 👨👩👧👦OpenAI创建家庭友好的GPT, 目标是为儿童、教育工作者和父母共同制定关于人工智能的指导方针和教育资源。
- Meta的Code Llama 70B(代码生成模型)。它在HumanEval基准上达到了67.8,高于GPT-4的67基本评级。现在可以在Huggingface、Perplexity或Ollama本地使用更大的模型。
- Midjourney 发布Niijourney V6: 10个能将Niji v6特性突出的例子盘点
🧰 AI新工具
- A2E Photo - 一项在线服务,使用人工智能技术将普通自拍转换为高质量肖像照片
- Qriginals - 一个允许用户使用艺术设计创建和自定义二维码的平台
- 👍 AutoThread AI - 一键从播客和YouTube视频生成Twitter线程的工具
##\s1月30号
🤯AI大事件
- 微软的 SliceGPT 可以删除高达25%的LLM参数,而不会大幅下降性能。
- Meta发布 Code Llama 70B,目前代码领域的开源最佳
- 百川发布 Baichuan 3, 据说 100B 以上的参数,官方宣称中文超越GPT-4。
🧰 AI新工具
- Cleanvoice AI - 一个用于音频编辑、从音频录音中删除填充声音、口吃、嘴巴声音和其他工件的工具
- Kansei.app - 一个人工智能语言学习平台,通过与逼真的人物的沉浸式对话提供个性化的语言练习
- Cactus interior -允许用户上传他们的房间照片,并以新鲜和独特的风格重新设计它们
🌍 AI世界动态
- 谷歌更新显示,Bard将分析您过去的私人消息。此外,Bard还将检查用户与不同联系人的消息历史记录,以根据他们的特定关系进行个性化响应。
- 意大利数据保护局标记OpenAI的ChatGPT违反了欧洲隐私法。 在欧盟处理个人数据需要有效的法律依据。
- 三星将在国内发布最新的Galaxy手机中使用百度的Ernie AI
1月29号
🤯 AI大事件
AI沃茨数字人课程 - 《克隆你自己》上线 小冰数字人👏
- 🏫 OpenAI迅速削减价格并解决“懒惰”GPT-4问题,新的预览模型也被称为0125,更全面地处理代码生成等任务,希望能缓解模型中途“放弃”的问题。
- 👀 ChatGPT Source Watch:监控ChatGPT前端代码来推测新功能
- 👏 跟GPT对话的时候可以@GPTs了!一次对话同时调用多个专家
- 🤯 Bard翻身可能性?11月26号的Chatbot排行榜上, Bard (Gemini Pro)仅次于GPT4-Turbo,位于第2
🧰 AI新工具
🌍 AI世界动态
- 👩💻泰勒·斯威夫特深度伪造事件加剧了对人工智能的担忧
##\s1月26号
🤯 AI大事件
- 💰 Poe聊天机器人推广活动:创建并分享聊天机器人。每带来一个订阅者,奖励50美金
- 🤩 ChatGPT新增小功能:自动展开代码输出 & 批量移动对话历史记录到存档
- 🤔 26种多模态大模型研究报告,涵盖模型架构 & 训练流程设计
- 😺 谷歌炫耀Lumiere。谷歌为其新的视频传播模式发布了一份新论文和一堆演示视频。据谷歌称,在Runway Gen-2、Pika和Stable Video Diffusion的测试中,Lumiere是用户的首选。
- 🆚 Adept Fuyu-Heavy - 一种新的数字代理多模态模型,击败了Gemini Pro。
🧰 AI新工具
- 💡 XNote - 一个由ChatGPT提供支持的笔记工具,可将手写笔记实时同步到数字设备
- 😂 AI Emojis - 一个使用AI生成各种表情符号的存储库,目前有超过158,000个表情符号
🚀 AI初创公司
- 蚂蚁集团成立了由前谷歌研究员领导的人工智能部门
- 谷歌解决了寻求16.7亿美元的人工智能相关芯片专利诉讼
1月25号
🤯 AI大事件
- 哄哄模拟器GPT版,支持挑战热门场景
- 谷歌发布AI视频模型:LUMIERE 支持文字生成视频和图片生成视频,演示效果很好。
- 随着新的Chrome版本(M121),谷歌通过三个新的人工智能功能
- 😺微软和其他公司为小企业开发人工智能, 在WEF,Satya Nadella(微软首席执行官)提到小模型的工作是“控制我们自己的命运”。
🧰 AI新工具
- 🎥GPTs - Invideo AI的VideoMaker-创建引人注目的AI旁白视频
- 💡 Devv - 一个由人工智能驱动的开发人员搜索引擎
- 📰 Hai News - 一款由人工智能驱动的新闻交互工具,可改变用户访问和参与新闻的方式
🚀AI初创公司
- Artisse AI为其更逼真的人工智能摄影应用程序筹集了670万美元。
- AIDash筹集了5000万美元,用人工智能发现野火
1月24号
🤯 AI大事件
- InstantlD:保持人脸不变,生成艺术照.类似腾讯的PhotoMaker,效果更好。仅需一张图片,与LoRA、ControlNet兼容。
- 🐰 TikTok上 Rabbit r1 演示了从提示到答案的响应时间需要20秒🐢
- 阿里即将发布通义干问2.0版本
🧰 AI新工具
- ✍️ OctiAI - 专为ChatGPT和MidJourney等各种AI模型设计的高级提示生成器
- 🖼 Catbird - 允许用户只需一个提示即可从数十个模型中生成图像
- 💻 Code-GPT - 帮助用户实时获得对所选代码的即时解释,提高编码理解和效率
🌍 AI世界动态
- 新罕布什尔州官员将调查模仿拜登的人工智能机器人电话。
- OpenAI暂停开发人员创建美国大选候选人迪恩·菲利普斯的机器人
1月23号
🤯 AI大事件
- 💬 HeyGen新功能【Real-time avatar】,联动GPT推出两种新互动方式
- 🍿 ElevenLabs(人工智能语音技术公司)刚刚获得了8000万美元的B系列资金,新的产品正在酝酿中。
- 🎨 零一万物发布多模态模型Yi-VL,额外引入视觉模块实现的多模态,分6B和34B两个版本
- GPT Auth引入GPTs应用用户认证:支持收费模式和跟踪GPTs使用情况
🧰 AI新工具
- 🔄 AIBypass - 绕过人工智能检测的人工智能重写器
- 🖼 OneRecovery - AI来恢复损坏的照片
🌍 AI世界动态
- 💻 OpenAI探索与台积电合作开发AI芯片工厂
- 🚴 在缺席四年后,英伟达首席执行官Jensen Huang回到中国,他先后在北京、上海和深圳停留,最终在公司活动中出现在舞台上
- 🙅 埃隆·马斯克否认了一份声称xAI从投资者那里获得了5亿美元的报告
1月22号
🤯 AI大事件
🎰 马克·扎克伯格对AGI的潜力下大赌注, 正在合并Meta的2个人工智能团队:Meta的人工智能研究(FAIR)和生成性人工智能产品开发
📑 OpenAI-与亚利桑那州立大学(ASU)合作。这是他们第一次与高等教育机构合作。从2月开始,ASU即将获得ChatGPT Enterprise的全套产品。🍿
🌊 微软推出AI朗读助手:由AI生成不同难度等级的文章(可以选择主角、场景,并由AI给故事配图),或者从图书库里选择文章进行朗读。用户朗读后AI进行打分,并指出哪些单词读的不准,针对不准的单词,还可以单独练习朗读。
🍎 AppleVisionPro全方位介绍和使用指南:提供中英文字幕 & 视频全长10分钟。
🧰 AI新工具
- 🎭 IP Adapter FaceID - 仅使用文本提示生成以面部照片为基础的各种图像。
- 🎯 AdIntelli - 通过植入聊天广告从您的GPT中赚取收入
- 📰 Deep News - 从DeepNewz获取实时新闻和趋势
1月19号
🤯 AI大事件
- 谷歌引入了“Circle to Search”,这是一种使用手势在Android上的任何地方进行搜索的新方法。您可以圈出(或涂鸦)图像和视频中的任何内容,以获得集中的搜索结果。
- Sam Altman在世界经济论坛达沃斯与Axios聊天:确认新模型名为GPT-5|首席科学家llya目前“隐居”|GPT的确有可能被用于军事
(模型三连)
- 来自谷歌 DeepMind 的新人工智能名为AlphaGeometry, 仅用合成数据训练就解决了国际数学奥林匹克竞赛几何问题。
- 书生浦语发布 InterLM2 系列模型,包括7B和20B,官方称20B与Yi-34B相当,7B模型在13B大小能力最佳
- 中文Mixtral-8x7B:基于Mistral发布的模型Mixtral-8x7B进行了中文扩词表增量预训练。 在中文知识和理解方面,与TigerBot-13B-Base-v3性能相当,中文解码效率比原模型提高41.5%
🧰 AI新工具
- Tweetify - 一种将文章和博客等长篇内容转换为简短而有效的社交媒体帖子的工具
- Uberduck - 一个开源语音人工智能社区,帮助用户在几分钟内创建人工智能生成的音频应用程序
- MagicBuddy - 由OpenAI的ChatGPT提供支持的电报( Telegram )机器人
1月18号
🤯AI大事件
- ⚖️ OpenAI正在创建一个新的团队,以征求公众对制定人工智能政策的意见。
- 🤯 谷歌正在保护其AI人才不离开加入OpenAI。谷歌正在利用每人价值高达数百万美元的快速归权股票赠款,以防止其在DeepMind的关键人才离开去OpenAI。
- Stability AI 发布了Stable Code 3B,可以在Macbook Air等没有GPU的笔记本电脑上运行。
🧰AI新工具
- 🧭 GPTS-2D - 创建多线程对话,以获得丰富的聊天体验。
- GPT-SoVITS - 中文的语音克隆,支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆。
- 💃 国产Wonder Studio - 阿里推出MotionShop 一键把视频中的人物替换成3D模型
🌍AI世界动态
- 🔫加拿大宣布限制人工智能研究资金
- 👾奥特曼说,人工智能的未来取决于能源突破。2021年,他向美国私人核聚变公司Helion Energy捐赠了3.75亿美元。Helion Energy随后签署了一项协议,向微软提供能源。
1月17号
🤯AI大事件
- 👩⚖️OpenAI将推出工具,在选举期间打击虚假信息。 如果您现在询问ChatGPT关于美国选举的情况,它不会讨论它,而是会将您转介到CanIVote.org
- 🧐特斯拉的机器人展示了T恤折叠技能,但Musk之处机器人在演示期间没有自主操作。相反,它只是遵循预定义的动作
- 微软为Copilot推出了Pro计划,每月20美元的Copilot Pro订阅可让你在Microsoft 365应用程序中获得其人工智能功能
- Perplexity Labs在聊天模式下免费提供Mistral Medium
- AI女友正在占据OpenAI的GPT商店😂
🧰AI新工具
- VideoDubber - 一种由人工智能驱动的工具,允许创作者将视频翻译成多种语言
- Img Upscaler - 一种允许用户使用AI快速轻松地升级(放大)图像的工具
- Sama - 捕捉每个对话的个人人工智能伴侣。iOS测试版推出,硬件即将推出。
- 🕵 Sixth SAST - 使用GPT4驱动的VSCode扩展进行编码的安全性。
1月15号
🤯AI大事件
- 1️⃣ 奥特曼在YCW24的演讲:暗示通用人工智能(AGI)接近实现,并建议以AGI实现为前提进行创业和技术开发。同时提到GPT-5可能实现指数级跳跃, 不建议专注于解决GPT-4限制
- 2️⃣ OpenAI已经注册了260个企业客户,总共有15万多名员工。
- 3️⃣ OpenAI支持的 1X 为人形机器人的竞争又筹集了1亿美元。
🧰AI新工具( CES 2024 专栏 )
- LG推出全球首款透明4K电视
- Holoconnects 的人工智能全息盒
- Portalgraph的新型VR投影仪技术
- 三星推出了一款名为Ballie的AI机器人伴侣
- DJI 首款送货无人机,可承载 66 磅重量超过 25 英里
- 索尼XR耳机与苹果新款Vision Pro竞争
- Rabbit r1 取代智能手机应用程序的人工智能助手
- Razer 推出的全球首款高清触觉游戏座椅“Project Esther”
🌍AI世界动态
- 1️⃣ 微软的人工智能热潮正在帮助它取代苹果成为美国最大的公司。
- 2️⃣ 人工智能如何取代Metaverse成为扎克伯格的优先事项(Facebook即将到来的20周年 )
1月12号
🤯AI大事件
- 山姆·奥特曼和比尔·盖茨谈论人工智能(大家这时候估计看到了Sam结婚的消息了)。
- 2️⃣ 亚马逊在CES 2023上宣布了Alexa的新生成AI功能。 包括 AI 聊天机器人平台 Character.AI、AI 音乐公司 Splash 和语音 AI 游戏开发商 Volley, 均可在 Amazon Alexa Skill Store 中获取。
- 3️⃣ 沃尔玛在CES上为购物者推出了新的GenAI搜索技术,使购物者能够使用特定场景而不是品牌名称或商品来搜索产品。
🧰AI新工具
- 1️⃣ Punky Ai - 一个由人工智能驱动的Discord机器人,旨在创建由分散组织管理的完全自主的Discord服务器
- 2️⃣ HappyChat AI - 一个可以集成到网站的聊天机器人工具
- 3️⃣ Summify - 用于总结YouTube视频的人工智能工具
- 4️⃣ Free link shortener 为您的自定义GPT提供免费链接缩短器
🌍AI世界动态
- 1️⃣ 🎓美国立法者公布了一项新法案,以应对人工智能带来的风险。 第一是要求所有联邦机构通过商务部去年发布的人工智能指南。第二是要求服务供应商适当公开其人工智能产品中使用的“数据、模型和参数”。
- 2️⃣ 世界经济论坛周三发布达沃斯报告 - 人工智能驱动的错误信息是未来两年世界上最大的威胁
1月11号
🤯AI大事件 (迫不及待玩GPTs Store去了)
GPTs商店上线!官方将GPTs分为了八大类(绘画/写作/研究分析/编程/教育/生产力/生活方式/其他),第一季度启动GPT开发者收入计划。同时还宣布了新的ChatGPT Team计划。
Rabbit推出了名为r1的人工智能硬件设备。 尺寸仅为普通手机的一半 ,并使用了没有应用程序的基于LLM的新操作系统,语音完成点餐,打车,预览新闻等。售价199美元
Quora(国外知乎)筹集了7500万美元的资金。Quora现在价值5亿美元,这笔资金将用于支付Poe上的创作者。
🌍AI世界动态
英特尔在 CES 上将“AI Everywhere”推向汽车市场,以提供电车能源管理和新的人工智能软件(结合昨天大众内置GPT,大模型未来很可能大范围应用在汽车上)
🧰AI新工具
- Kansei.app - 一个人工智能语言学习平台,通过与逼真的人物的沉浸式对话提供个性化的语言练习
- Sendspark - 只拍摄一个视频。然后,使用人工智能自动为每个观众个性化每个视频。
1月10号
🤯AI大事件
- ⚖️OpenAI反驳《纽约时报》的版权诉讼后续: 《纽约时报》可能通过制作有针对性的提示来故意制造“抄袭”示例
- McAfee在CES 2024期间推出了人工智能驱动的深假音频检测工具Project Mockingbird
- Rabbit Tech计划于太平洋时间今天上午10点推出一款带有LLM的移动设备。
🌍AI世界动态
- 大众汽车将在未来的汽车中使用ChatGPT人工智能技术, 升级其当前的语音助手IDA
- Duolingo多邻国削减了10%的承包商,因为它使用更多的人工智能来创建应用程序内容。
- X的前信任和安全主管Ella Irwin加入Stability AI,担任高级副总裁。自10月份的300万美元报告以来,Perplexity的收入翻了一番,达到600万美元。
🧰AI新工具
- FindWise - 人工智能驱动的搜索助手,允许用户根据网站内容提问并获得答案
- Levity - 这是一个可以自动执行日常任务的平台,如电子邮件外联回复、库存管理、调查回复
1月9号
🤯AI大事件
- 微软已任命Deannah Templeton担任OpenAI董事会的观察席位。OpenAI的董事会还就可能加入与Scale AI首席执行官Alexandr Wang和前GitHub首席执行官Nat Friedman进行了联系。
- 初创公司@Figure_robot 的Figure-01机器人现在可以自己煮咖啡了。 仅通过观察人类制作咖啡的录像,10小时内学会了制作咖啡的技能。
- Midjourney 被曝光未经许可使用了包含 16000 名艺术家的作品风格来训练其图像生成AI。 一些艺术家已经对 Midjourney 和其他公司提起了集体诉讼
🧰AI新工具
There's An AI For That 月榜
- 💄 Glambase -使用Glambase制作您的虚拟形象。
- 🎤 WavoAI -将您的音频转换为可操作的见解。
- 📚 Study Like Pro -使用人工智能将您的材料组织成结构化课程。
🌍AI世界动态
- 英伟达将于2024年第二季度推出以中国为重点的人工智能芯片 H20
1月8号
🤯AI大事件
- 谷歌概述了使用视频和大型语言模型训练机器人的新方法
- 谷歌正在准备付费版的Bard。Bard网站上的隐藏代码通过Google One免费揭示了3个月的Bard Advanced,并泄露了更多即将推出的功能,包括类似GPT的机器人。
- OpenAI GPT商店本周推出。来自官方品牌指南:“不鼓励GPT的名称或者以“GPT”结尾,但不禁止。”
- OpenAI 回应被指控侵权:《纽约时报》提示策略违反其服务条款
🧰AI新工具
🌍AI世界动态
- 意大利将优先考虑人工智能作为七国集团峰会的关键议程项目
- 在即将到来的CES( 由消费者技术协会组织的年度贸易展 )上,NVIDIA将公布AI的重大更新,聚焦在GeForce RTX 40系列超级GPU上。
1月4号
🤯AI大事件
微软利用合成数据训练AI:覆盖了近100种语言的数十万个文本嵌入任务, 成功生成了大约50万个示例
M2UGen: 由腾讯与新加坡国立大学开发的多模态音乐理解生成模型, 能够识别和理解不同的音乐风格、乐器种类及情感表达, 还能根据文本、图像和视频内容自动生成和编辑音乐
DreamTalk:阿里巴巴开源人物头像动画生成工具,使人物照片头像根据音频说话或唱歌,还有唇型同步。
Midjourney公司计划在未来几个月推出“文本转视频”模型,通过在1月开始培训视频模型,强调其自然发展和在生成视频领域引入竞争动态,同时V6更新提升画质和用户体验。
🧰AI新工具
Auto Ye AI - AI驱动的歌词生成器,用于创建受Kanye West歌曲启发的歌词
Grafi.ai - 专为医疗保健和医疗作家设计的人工智能内容生成平台
Savey Meal-Bot - 通过使用剩余的食物为用户提供新的食谱,确保没有浪费
🌍AI世界动态
1月3号
🤯AI大事件
创建GPTs独立小应用教程(自定义API的GPTs)
OpenVoice 语言克隆(即时克隆),能控制声音风格;中文短文本支持还不错
🧰AI新工具
- Piktochart AI - 使用人工智能快速创建高质量信息图表的信息图表生成器
- SEO Writing AI -由AI驱动的内容创建工具,用于SEO优化的文章、博客文章和附属内容
- Kamoto.AI - 一个直观的平台,允许用户创建、训练个性化人工智能角色并从中赚钱
🌍AI世界动态
- 网络安全专家Mikko Hyppönen分享了2024年最大的人工智能威胁: 深度伪造 Deepfakes, 2023年激增了3000%
1月2号
祝大家开工大吉
🤯AI大事件
- OpenAI的年化收入已超过了16亿美元,高于10月中旬预估的13亿美元。
- 微软在IOS平台上架了Copilot,允许用户访问 OpenAI 的 GPT-4,并且完全免费。
- 阿里巴巴推出AnyText的绘图工具,可以按照指定位置精准地向图中加入文字,支持中英日韩四种语言,不仅字形准确,风格也可以与图片完美融合。
🧰AI新工具
- Hai:一个由人工智能驱动的应用程序,帮助用户轻松约会
- HelpMoji:创建辅助游戏AI co-pilots
- Ollama-voice-mac - 使用本地化Mistral 7b的大模型语音助理
🚀AI初创公司
🌍AI世界动态
- 🧐三星计划通过整合人工智能来复制人类视觉
- 👓Meat预测AI智能眼镜将成为2024年的下一个主要趋势
详情🔎地址:https://www.learnprompt.pro/daily
12月29号
祝大家开工大吉
🤯AI大事件
- 《纽约时报》就使用文章训练人工智能聊天机器人对OpenAI和微软提起诉讼。 纽约时报要求赔偿并销毁相关AI模型。
- 23年LLM数据/尺寸/context对比图🎉
🧰AI新工具
- Highcharts - 一种使用ChatGPT的自然语言处理能力在几秒钟内生成安全可靠的数据可视化的工具
- Assistive Video:新的AI生成视频的工具:通过文字提示或图片生成视频内容,用户可控制视频质量和内容一致性。
🌍AI世界动态
- 百度首席技术官王海峰透露,百度Ernie Bot拥有超过1亿用户
- Reliance Jio和IIT-Bombay将建立印度的“BharatGPT”聊天机器人
- 👾NVIDIA H100 AI GPU的用电量与危地马拉一样多; 如果在每次谷歌搜索中使用生成人工智能,每天的耗电量将达到80 GWh
12月28号
🤯AI大事件
- 微软推出安卓版Copilot APP,使用的是GPT-4,支持GPT-4V, 支持使用DALL-E 3生成图片,目前免费。
🧰AI新工具
🌍AI世界动态
- 👩❤️👨 Hinge创始人Justin McLeod表示,人工智能将改变约会应用程序的游戏规则。来自Tidio调查的54%的受访者表示,他们更喜欢人工智能帮助根据个性化标准找到匹配项,而46%的人表示有兴趣使用应用程序分析他们的书面简历,以与有共同兴趣的人建立联系。
- 苹果的iPhone设计主管将辞职,与Jony Ive、Sam Altman一起研究新的人工智能设备
12月27号
🤯AI大事件
- 微软发布PromptBench,为评估大型语言模型设计,支持主流模型
- ComfyUI教程知识库:为学习Stable Diffusion提供教程和指南。
- YAYI2:雅意30B中文大模型,排名跟李开复的YI-34B接近,政企大模型定位是做政府和国企客户
🧰AI新工具
AI Human Generator - 使用先进的 AI 算法创建超逼真的人物全身照片的工具
Team-GPT - 一个协作工作空间,允许团队一起工作并掌握 ChatGPT
🌍AI世界动态
- 埃隆·马斯克 (Elon Musk) 的 Grok AI 在印度首次亮相
12月26号
🤯AI大事件
最近的 Twitter Space 会议中,埃隆·马斯克 (Elon Musk) 分享了他对 2024 年的AI技术预测(AGI+Agent)。 并且他打算让最近推出的Grok 在未来十年成为“真相改进者”(解决模型幻觉)
微软研究人员推出 InsightPilot:LLM 授权的自动化数据探索系统,使用自然查询来简化数据分析
🧰AI新工具
数字人应用 Spiritme AI ScriptWriter :用数字人创建个性化的教育和营销视频。让GPT对你的PPT做解释 然后产出数字人讲解视频,ProductHunt上上热门第一了
Banner GPT - 一种为博客文章生成横幅图像的人工智能工具(公众号同样好使)
🌍AI世界动态
- 美国插画家帕洛玛·麦克莱恩 (Paloma McClain) 与芝加哥大学研究人员合作创建的名为 Glaze 的免费软件。以人类无法察觉的方式调整像素,使得数字化艺术品看起来与人工智能截然不同来保护版权
12月25号
🤯AI大事件
🧰AI新工具
ChatGPT Unwrapped - 为您的ChatGPT聊天创建一年回顾
Tinyquiz - 一种允许教师快速、轻松地生成测试和测验的工具
MagicReply一个客户服务的人工智能助理,与人类一起工作,提供个性化答案
🌍AI世界动态
- 埃隆-马斯克称互联网充斥着胡言乱语,承诺Grok人工智能将与时俱进
- 比尔·盖茨在他的年度展望中谈了很多关于人工智能的事情。特别是关于医疗保健中的人工智能:对抗艾滋病毒,使怀孕安全,并处理抗生素耐药性。
12月22号
🤯AI大事件
Midjourney V6 现已在 Discord 上线。在提示符中添加"-v 6 "即可使用;支持更长更自然的提示次,能绘制文字(附上手评测)
Mistral-Medium在Poe上可以使用了,英文对话能力超过了ChatGPT-3.5
🧰AI新工具
🚀AI初创公司
- Anthropic公司( Claude )再融资 7.5 亿美元,估值为 150 亿至 200 亿美元。两轮融资之间间隔时间很短。据说本轮融资由 Menlo Ventures 领投,尚未结束。
🌍AI世界动态
普利策奖得主在内的 11 位著名非虚构类小说作家对 OpenAI 和微软提起了诉讼
英国最高法院裁定 AI 不能成为专利 "发明者"
12月21号
🤯AI大事件
微软 Copilot 通过整合 Suno 获得AI音乐创作功能
Anthropic 扩大了其 API 的法律保护范围。自 2024 年 1 月 1 日起,Anthropic 将保护客户免受因授权使用 Anthropic 服务或其输出而遭到的版权侵权索赔。
苹果公司最近发布了一系列与 Gen AI 相关的研究论文: HUGS (Human Gaussian Splats) - 根据视频创建动画 3D 人类头像。 LLM in a Flash - 在内存有限的情况下加快 LLM 推断速度。 期待看到苹果公司在 2024 年的新成果。
activeloop,TowardsAI和intel联名推出基于 LangChain和LlamaIndex RAG 课程
🧰AI新工具
- AiHuman - 一种人工智能头像解决方案,可通过经济高效的 24/7 全天候服务提高客户参与度
- TutorAI - 分享您想学的东西的提示,它会为您生成课程
- Pixelcut - 允许用户快速、轻松地创建专业品质的产品照片
🌍AI世界动态
印度致力于创建人工智能全球框架,推出智能印度黑客马拉松 (SIH)
12月20号
🤯AI大事件
- OpenAI 宣布应对人工智能危险的新措施:"准备框架" Preparedness Framework
- 谷歌Bard三连更
- YouTube、Gmail、地图上的bard插件支持了日语和韩语版本
- 现在可用于 18 种以上的编程语言,包括 C++、Javascript、Ruby 和 Swift。
- UK英国版本的Bard现在是由 Gemini Pro支持
- OpenChat-3.5-1210,超越 GPT 3.5 和 Grok 模型的全新 7B 开源。
- Mistral的CEO ArthurMensch 在法国国家广播电台上宣布,Mistral将在2024年发布GPT-4级别的开源模型。
🧰AI新工具
- Mobirise - 一种人工智能驱动的网站构建工具,用户无需任何编码知识即可创建具有视觉吸引力和功能性的网站
- MidrealAl:交互式生成小说,类似选择故事线的文字游戏,只不过完全是由AI写的,你可以选择故事分支继续写;还支持生成配图,把小说和配图整合到一张图片中分享。
🌍AI世界动态
- Genrobotics 在全球人工智能峰会上跻身印度三大初创企业之列, 开发了 G Gaiter 一种AI驱动的机器人步态训练器,训练那些因中风、脊柱损伤、事故、帕金森病和类似疾病而失去行动能力的人
- Martian 为动态 LLM 路由筹集了 900 万美元,通过实现 LLM 动态切换以降低成本
12月19号
🤯AI大事件
- Midjourney V6模型下周发布,用户评价显示在复杂画面信息还原和内容绘制上有显著提高。
- v0 by Vercel - 利用文本或图像生成前端代码。现在向所有人开放
- 陪伴型AI 新风向:Digi: 自定义伴侣/好感度系统等
🧰AI新工具
- ComfyUI Web - 基于 Web 的 Stable Diffusion 界面 ,允许用户根据文字描述生成逼真的高清图片
- MyEssayWriter.ai - 一种人工智能论文写作工具,可帮助学生进行学术写作
🌍AI世界动态
- OpenAI 推出第二轮人工智能创业基金 Converge 2 , 向 15 家选定的人工智能初创公司每家投资 100 万美元
- 「实在智能」完成近2亿元C轮融资,推出基于自研大模型的Agent智能体
12月18号
🤯AI大事件
- OpenAI更新提示工程指南
- GPT-4.5-Turbo 正在灰度:输入对应文字,即可确认!
- DeepMind 人工智能在未解难题( 纸牌游戏 Set )上超越人类数学家
- AnimateDiff v3发布: 新增支持控制视频生成的过程,目前支持线稿和RGB图片
🧰AI新工具
- DomoAI - 上传照片和视频,选择提示词和指定动漫风格,即可将你的照片和视频动漫化
- Pinbot - 利用人工智能使用户能够私下准确搜索其浏览历史记录
- Feng My Shui - 一种人工智能驱动的工具,通过将 Midjourney 的模型与其他人工智能模型相结合来生成图像
- GPT Router - 流畅管理多个 LLM 和图像模型
🌍AI世界动态
- 英特尔推出专用 AI 芯片与英伟达竞争
- 牛津大学现在允许学生在经济学和管理学课程中使用人工智能。
12月15号
🤯AI大事件
- OpenAI新闻三连
- Converge 2 - Open AI 基金的第二批学员。该项目为期六周,面向使用人工智能重新想象世界的杰出工程师、设计师、研究人员和产品构建者。
- ChatGPT Plus 又回来了。Sam 和团队找到了更多 GPU。
- 有传言称 GPT-4.5 即将推出。可能是 OpenAI 定价页面的假复制品,但包括音频、语音、视频和 3D 模型。
- 谷歌在 API 中提供了 Gemini Pro 。Gemini Pro 是新的人工智能模型 Gemini 系列中的第二好模型。目前,Gemini Pro 对开发人员和企业免费开放,可供他们开始使用。
🧰AI新工具
- Mindie - 允许用户与网络上遇到的任何内容进行对话,如 YouTube 视频、博客文章等
- Viroll - 一种人工智能驱动的视频编辑工具,可帮助用户创建视频中的精彩片段
- Duet AI for Developers - 谷歌的人工智能代码助手现已全面上市
🌍AI世界动态
- 谷歌为医护人员推出先进的人工智能模型: MedLM: 大型医院运营商 HCA Healthcare 正在使用该技术帮助急诊科医生起草病人笔记
- 根据 Statista 研究部的预测,到 2030 年,中国人工智能驱动的经济增长将超过世界其他国家,对 GDP 的贡献率将达到 26.1%。北美和阿联酋预计将紧随其后,贡献率分别为 14.5% 和 13.5%
12月14号
🤯AI大事件
- Sam Altman 谈他在 OpenAI 的下台经历
- Microsft 发布 Phi-2, 仅2.7B参数,超越了分别拥有7B和13B参数的Mistral和Llama-2模型
- Midjourney Alpha(测试版本)正式来了!
🧰AI新工具
- Mysports AI - 利用深度学习和广泛的数据收集来预测体育比赛结果的人工智能预测平台
- Nunu AI - 打造首个多模态游戏代理(Agent)
🚀AI初创公司
- Essential AI 融资 5650 万美元,开发全栈人工智能产品,这些产品可以快速学习,通过自动化耗时且单调的工作流程来提高生产力。创始人阿希什-瓦斯瓦尼和尼基-帕尔马是最初的 Transformers 论文 "Attention is all you need "的作者。
🌍AI世界动态
- 印度总理在新德里为全球人工智能峰会揭幕
12月13号
🤯AI大事件
- Runway ML 的通用世界模型--Runway 宣布将开展一项新的研究工作,以创建世界模型,建立环境的内部表示,并用它来模拟该环境中的未来事件。
- MistralAI发布A平台 La Plateforme,提供Tiny / Small / Medium三种型号API
🧰AI新工具
- Mixtral MoE + Together AI - Mixtral 8×7B 现已登陆 Together AI 平台,价格比 GPT 3.5 Turbo 便宜。
- Claude for Sheets - 在电子表格中使用 Anthropic 的 Claude。需要 Anthropic API 密钥才能使用😂
🚀AI初创公司
12月12号
🤯AI大事件
- Meta 公司宣布推出一个开源项目--Purple Llama,为开发负责任的人工智能生成模型提供信任和安全工具及评估。
- Anthropic 开发了新方法,用于减少贷款、工作、保险索赔等领域语言模型决策中的歧视。涵盖社会上 70 个不同的决策场景
- Stability AI 推出 StableLM Zephyr 3B,旨在普通硬件上提供准确、快速的文本生成,基础能力超过Falcon-40B
🧰AI新工具
🌍AI世界动态
- 欧洲同意具有里程碑意义的人工智能监管协议。 该协议要求 ChatGPT 和通用人工智能系统(GPAI)等基础模型在投放市场之前遵守透明度义务
- 英伟达探索与越南合作,计划在该国建立亚洲人工智能芯片基地
- AMD 推出 Instinct MI300X 和 MI300A AI 加速器
12月11号
🤯AI大事件
- Mixtral8x7B:MistralAl发布的混合专家模型 由8个7B模型混合的模型,即 mixture-of-experts(MoE),据说GPT-4 使用的就是这种模型。
- StripedHyena 现有大多数模型是基于 Transformer ,而TogetherAI推出 了StripedHyena,可以替代训练和推理过程中的Transformer,而且在长上下文的情况下速度更快。同时推出了对应的LLM: StripedHyena-Nous-7B
🧰AI新工具
- Gordon Post - 一种提供新闻文章摘要的人工智能工具
- Platie - 一个提供食物营养估算的人工智能平台
🚀AI初创公司
- Mistral AI 以 20 亿美元的估值筹集了 4.15 亿美元,较上一轮估值增长了近 8 倍, 可能是有史以来增长最快的开源公司
- 埃隆·马斯克已确认他不会为 xAI 筹集资金,他不需要钱。他需要 GPU😂
🌍AI世界动态
- 经过马拉松式辩论,欧盟人工智能法案谈判将于周五重启
- 英伟达与马来西亚杨忠礼就数据中心交易进行谈判
12月08号
🤯AI大事件
- 马斯克的Grok大模型使用条件: X会员开通至2档Premium+;美国IP;XAPP更新至最新版; 智商和情商都在线,能实时检索推特内容
- OpenAI公开表示收到社区关于 GPT4 变得更加懒惰的所有反馈!并表示“自 11 月 11 日以来我们就没有更新过模型,这当然不是故意的。模型行为可能是不可预测的,我们正在研究修复它”
- 与之对应的“对抗 GPT4 惰性的prompt魔法”出现了!😂
🧰AI新工具
- Alter AI - 一个人工智能平台,利用机器学习模型将业余自拍照转化为专业头像
- HitPaw 视频增强器 - 一种由人工智能驱动的工具,可通过将低分辨率视频提升至更高分辨率来增强视频质量
🌍AI世界动态
12月07日
🤯AI大事件
- 山姆-奥特曼是《时代》周刊的年度 CEO。他们设立了一个新的类别,因为泰勒-斯威夫特(Taylor Swift)是年度人物
- Meta 发布了 Emu 图像生成模型的独立工具,声称用了facebook和ins上图片训练
- Meta, OpenAI 将使用 AMD 芯片,而不是 NVIDIA 芯片
🧰AI新工具
- n8n* - 面向技术用户的低代码平台,用于管理复杂的工作流程和人工智能应用程序。可自行托管、提供源代码且灵活
- Meta 的 Seamless Expressive demo - 保留情感的语音到语音翻译。
- Speechnotes - 一种语音转文本工具,可让您转录音频和视频录音,并使用语音听写笔记
🚀AI初创公司
- 成立 5 个月的初创公司 Sarvam AI 获得 4100 万美元种子轮融资,用于建立印度语言的基础模型
🌍AI世界动态
- 印度尼西亚为开发者起草人工智能道德准则
- 根据UserLike的数据,68%的用户喜欢聊天机器人的回复速度,但60%的人担心聊天机器人能否准确理解他们的询问
12月06日
🤯AI大事件
- 谷歌深夜发布了 Gemini,并将直接将人工智能集成到谷歌应用程序中,拥有3 种型号:Ultra、Pro 和 Nano
- 🏘️Meta 与 IBM 成立开源 AI 工作小组 ,就支持开放和负责任的人工智能系统的项目开展合作
- 与 ChatGPT 一样,微软的 Copilot 也 1 周岁啦,微软正在为此庆祝。它承诺将在 Copilot 中加入更多的人工智能功能
- 苹果公司发布了 MLX - 适用于苹果芯片的阵列框架
- 埃隆-马斯克(Elon Musk)希望为 xAI 筹集 10 亿美元,目前已筹集到 135 美元。
🧰AI新工具
- Playground V2 - Playground AI 的新图像模型,美学至上,POE上可用
- Respell - 结合无代码工作流、代理聊天和人工智能建议,实现工作自动化
- Magnific AI - 图片实现超高清升格
- Westidol--让用户只需一张自拍照就能创建专业摄影作品
🚀AI初创公司
- 企业如何在客户入职培训中使用人工智能的文章。尝试一些展示企业如何使用人工智能的内容。我对 Zapier、Eleven Labs、Typeform 等公司进行了分析
- Replicate 在其 B 轮融资中获得 4000 万美元。Replicate 在其博客中提到了像 Levelsio 和 Danny 这样的独立构建者,并将共同构建作为他们旅程的一部分。
12月05日
🤯AI大事件
- Gemini 的更新: 在 Google 悄悄取消了一系列现场活动来推出 Gemini 后,它现在正计划为记者和软件开发人员提供虚拟预览,该预览最早可能会在本周进行。
- 字节跳动新开源基于SD 1.5的 MagicAnimate,只需要一张照片和一组动作,就能生成近似真人的舞蹈视频。 抖音新时代将由此诞生 🤯
- VideoSwap 更换视频中的主体角色!将用户自定义的概念替换为视频,同时保留背景。
🧰AI新工具
- GPTAuth - 控制您的自定义 GPT 访问, 防止未经授权的使用
- Checkmyidea - 一项人工智能驱动的服务,帮助企业家评估他们的副业想法
- Thing Translator - 允许用户使用手机的摄像头将物理对象从一种语言翻译成另一种语言
- Highcharts - 一种使用 ChatGPT 自然语言处理能力在几秒钟内生成安全可靠的数据可视化的工具
🚀AI初创公司 好图推荐:50 个访问量最大的人工智能工具访问量超过 24B
🌍AI世界动态
- 英伟达首席执行官黄仁勋做出了一个大胆的承诺:在对其AI处理器的巨大需求将优先考虑日本的需求
- 新加坡将人工智能人才库扩大两倍;建设“标志性”人工智能网站作为更新的国家战略的一部分
- 思科(科技公司)的人工智能就绪指数显示,只有 7% 的德国企业为人工智能时代做好充分准备,远低于 14% 的全球平均水平。
11月27日
🧰AI新工具
- VectorArt AI - 使用 AI 创建矢量图像
- UIdraw - 在手机上绘制和构建网站
- Concept Sliders - 精准控制SD绘画的某项属性,包括年龄、某个表情的幅度、眼睛大小等,甚至可以设置修复手部的程度
- 完全免费的Stable Video Diffusion图片转视频在线工具
🚀AI初创公司 Microsoft vs 谷歌 vs 英伟达🏇投资摘要: 1) 英伟达 - 对基础设施堆栈的大量投资,尤其是基础模型公司 2) 谷歌 - 投资一切。医疗保健和生物技术领域的显着差异 3) Microsoft - 企业软件、基础设施、硬件重点 🌍AI世界动态 为避开 GPU 禁令,中国工厂将 RTX 显卡改造成 AI 加速器 西班牙首个AI模特月收入高达 1 万欧元
11月25日
🤯AI大事件
- Jim Fan关于Q star的推测,四大组件: 策略神经网络+ 价值神经网络+ 搜索+ 真实信号
🧰AI新工具
- Magnific - 一种人工智能驱动的图像增强器,可提高图像的分辨率和细节
- Jupitrr AI 视频制作工具 - 一种可自动创建内容营销视频的工具
- GPT Researcher - 一种利用人工智能技术生成详细研究报告的工具
- Strongr Fastr - 一种宏观膳食计划工具,可根据个人的宏量营养目标生成定制的膳食计划
🚀AI初创公司
- Adobe刚刚收购Rephrase AI (金额未公开)一个文本到视频生成工具,与 Synthesia 竞争Rephrase AI 筹集了$13.9M,项目是由 3 名 IIT 毕业生发起
🌍AI世界动态
- 英国新法律允许为人工智能关键技术及其训练过程申请专利
- 一级方程式大赛探索使用人工智能监控赛道违规行为
- 日本 ABCI 超级计算机将进行重大升级,以提高人工智能研究能力
- 微软计划将泰国打造为人工智能中心
11月24日
🤯AI大事件
- 埃隆-马斯克透露 xAI 的聊天机器人 Grok 将于下周向 X Premium+ 用户推出, Grok 还将实时访问 X 的信息
- 英特尔发布了 最好的7B模型 ---Mistral 7B 微调版
- 英伟达(Nvidia)推迟推出新的中国 AI 芯片。此前有报道称,H20 芯片将于 11 月中旬推出,但最终推出时间推迟至 2024 年第一季度,有可能在 2 月或 3 月推出。
🧰AI工具推荐
- Resume screener template by LlamaIndex - 给出候选人的简历,判断其是否符合职位描述
- Dubecos - 简单快捷的人工智能视频配音应用程序
- DrawMyToday--一款利用人工智能根据你的日记和情绪绘制日常生活图画的应用程
- Guidie--一款人工智能城市指南,可使用设备的摄像头即时提供有关地标性建筑、历史遗迹和隐藏宝藏的信息
🚀AI初创公司推荐
OpenAI Q* 解决合成数据难题;合成数据是AGI 🔑 的关键 前 3 名初创公司 + 资金: Scale AI - $603M Datagen - $72M Gretel - $68M
🌍AI世界动态
- Stable Diffusion 和 Code Llama 现已成为 Cloudflare 中人工智能服务,已推动到100个城市
- 英国财政大臣承诺投资 5 亿英镑推动英国人工智能发展
11月23日
🤯AI大事件
- 人工智能公司 Inflection 发布了新的大模型 Inflection-2,称世界上第二好👍仅次于 GPT-4。
- Sam回归后,OpenAI 招标将继续进行。由 Thrive Capital 主导的员工股票出售,对 AI OpenAI 的估值为 860 亿美元。
- 揭秘导致Sam被解雇的OpenAI技术突破:一项名为 Q *(Q star)的新研究能够解决小学水平的数学问题。现阶段猜测是为 Q learning和 A -star的混合体。
- 谷歌Bard现在可以帮助理解 YouTube 视频了。
🧰AI新工具
Readany - 将任何网站变成播客/有声读物。 Grail Writer - 利用OpenAI API生成无限制的 SEO 优化文章 Voice Changer by ElevanLabs - 将你的声音转换成另一个角色,并控制其情感和表达。 Ankara AI--使用人工智能为视频生成旁白的应用程序
🚀AI初创公司
Defog 融资 220 万美元,构建用于数据分析的 LLM
🌍AI世界新闻
美国机构FTC简化人工智能相关调查 百度三季度云业务首现营收下滑称芯片禁令影响有限
11月22日
AI新技术发布:
- 🌐 Claude 2.1发布,特性包括200K代币上下文窗口、幻觉率降低、系统提示、工具使用、更新定价。
- 📱 ChatGPT Voice向所有免费用户开放,可通过手机应用对话。
- 🎥 Stability AI发布Stable Video Diffusion视频开源模型,支持文本到视频、图像到视频等多种功能。
- 🛠 "Tuna"工具发布,用于快速生成LLM精细调优数据集,支持无代码操作。
- 📖 微软230页报告评估GPT-4在科研领域的应用潜力,如生物学、药物发现等。
- 🚀 北大开源Video-LLaVA视频大模型,用于视频质量评价。
企业变动信息:
- 🤖 Sam Altman(山姆 奥特曼)重返 OpenAI CEO 职位,董事会成员变为 Bret Taylor(主席)、Larry Summers、Adam D'Angelo。
- 🚫 Sam Altman被解雇后,ChatGPT发布首个更新内容。