
谷歌在其实验性AI平台Google Labs中推出了Whisk Animate的预览版,允许用户利用先进的Veo2模型将静态Whisk图像转化为8秒的动态视频剪辑。Whisk Animate的推出标......

Spark-TTS是一款先进的文本转语音系统,凭借其零样本语音克隆和细粒度语音控制能力,该系统基于Qwen2.5构建,简化了音频生成流程,提高了效率,并支持多语言生成......

字节跳动为其AI助手豆包推出的“深度思考”推理模式,通过可视化的逻辑链条,提升了用户对AI的信任度和透明性。这项技术基于豆包1.5模型,结合深度推理模型的技......

OpenAI近期宣布,最新的人工智能模型GPT-4.5将逐步向ChatGPT Plus用户开放。尽管该模型在对话能力上有显著提升,但在复杂推理方面仍存在不足。使用成本高达每百......

阿里巴巴的Qwen团队推出了开源大型语言模型QwQ-32B,旨在通过强化学习提升其在复杂问题解决任务中的性能。该模型以320亿参数和131072 tokens的扩展上下文长度为......

全球首款通用智能体Manus引发了科技圈的广泛关注。Manus具备独立思考和执行复杂任务的能力,能够交付完整成果,展现出强大的通用性。它不仅能处理日常事务,还能......

在信息爆炸的时代,Mind Mapper 应用程序成为了思维整理的得力助手。它能够将用户的想法转化为生动的思维导图,只需输入网址、YouTube 视频链接或文本提示,便能......

在图像生成领域,微软研究人员推出的“Anonymous Region Transformer”(ART)技术,革新了用户与生成模型的互动方式。通过匿名区域布局,ART能够根据全球文......

DiffRhythm的问世标志着音乐创作的新时代,它通过扩散模型实现了端到端的自动生成音乐,用户只需输入歌词和风格,即可在短短10秒内获得一首完整的歌曲。其生成速......

xAI公司的AI助手Grok正式向所有用户开放其备受期待的语音模式,带来了11种独特的语音交互模式和语音字幕功能。这一更新不仅增强了用户的互动体验,还为英语学习......

即梦与DeepSeek的合作为AI绘画爱好者带来了极大的便利。通过DeepSeek的智能提示词生成功能,用户不再需要为创作灵感而烦恼,只需简单输入需求,便能获得精准的提......

抖音App正在测试接入豆包AI,通过在短视频界面和消息列表中开放入口,抖音旨在打破AI产品与流量平台的壁垒,提升AI能力并引入更多用户流量。字节内部还在推进多......

QQ浏览器推出的“AI作文辅导”功能旨在帮助学生提升写作能力,而不仅仅是提供答案。该功能通过全流程的写作技巧辅导,帮助学生在立意、提纲、素材和范文生成的每......

火山引擎通过X平台宣布大模型应用正式开源,并推出全新“大模型应用实验室”平台。源应用涵盖手机助手、Deep Research等前沿AI工具,受到用户热议,展现了火山引......

DeepBeepMeep团队推出的Wan2.1GP是一个针对低端GPU用户优化的视频生成模型,基于阿里巴巴的Wan2.1,旨在为缺乏高性能GPU资源的用户提供强大的视频生成能力。该模......

上海秘塔网络科技有限公司推出了新的AI搜索功能,新增了视频搜索模块。这一功能通过分析大量视频内容,帮助用户更高效地找到所需的学习和娱乐视频。用户可以快速......

智谱推出了CogView4,这是首个支持生成汉字的开源文生图模型,具备强大的双语输入和图像生成能力。该模型在DPG-Bench基准测试中排名第一,成为开源文生图模型中......

百度文库与百度网盘联合推出的AI创作工具“自由画布”正式上线,旨在通过大模型技术打通公域与私域内容的界限。用户可通过简单的拖拽操作,实现多格式文件的混合......

Sesame团队正在开发一种全新的“语音存在”概念,旨在让数字助手不仅能执行命令,还能进行真实的对话。他们通过情感智能、对话动态、上下文意识和一致的人格特征......

Flora推出了一种全新的AI驱动工具,旨在为创意专业人士提供更高效的创作体验。该工具不仅仅是生成内容的玩具,而是一个“无限画布”,用户可以在上面自由生成和......