
据媒体报道,Mososhot AI正式推出了其第一个代理产品Kimi-Osearcher,并开始进行小规模测试。该产品基于自主端 - 到末端加固技术(End -end to -end Agent RL)。除了Claude 4 Opus,Gemini 2.5 Pro和Operai深入研究之外,它在HLE测试中效果很好,并且与Gemini-Pro Deep Search Agent相当。 Kimi-Osearcher是一位高度自主且聪明的研究助理,可以独立计划任务流程并提供完整的结果。与其他代理不同,它使用具有零的结构化设计,而没有复杂的单词,快速或预先建立的过程,并且完全基于独立决策 - 制定功能来在动态环境上操作。例如,如果与信息发生冲突,任务节点的变化时刻和中间信息的补偿标准及其主要驱动力始终是任务的真正解决方案效果,那么您可以确定薪酬STR田园。作为一个详细的研究模型,Kimi-Isparter整合了来自多个来源的数据,支持每次任命的直接可追溯性,确保调查的严格性并有效地减少了幻觉问题。月球的黑暗面在金 - 梅尔(Kim-Merp)的基本训练模型和学习强化学习中说,优化版本将逐渐打开,从而促进了代理商增强加固学习领域的探索和发展。