史上首位AI科学家横空出世,自动生成十篇完整学术论文!Sakana AI带来革命性突破,自动化科学研究与发现。从想法生成到论文完成,AI科学家全程搞定。额外推出AI审稿人,提供改进意见。了解AI科学家的炼成、挑战及Sakana AI的更多信息。   阅读全文

AI初创公司Cosine推出最强AI程序员Genie,模拟人类编程思维,自动执行编程任务,无需干预。Genie在SWE-Bench测试中得分30%,居首位,展现高效编程能力。通过独特数据集训练,Genie模拟人类工程师解决决策问题。   阅读全文

本文介绍了10个有效的提示词技术,包括激励机制、避免负面指令、示例提示、双向提示、链式思维提示、结构化格式、输出预设、任务强调、提及后果和自我评估提示。这些技术可以帮助人们更有效地与AI互动,提高AI的输出质量和准确性。作者Moritz Kremb总结了这些技巧,为人工智能交互提供了宝贵的指导。   阅读全文

病毒式传播的“毒舌AI”Twitter个性评估应用火遍全球,只需输入推特用户名,AI将根据历史发言做出犀利点评。应用已吸引大量用户,并在短时间内实现显著增长。开源平台Wordware助力AI应用的开发与普及,引发全球关注。   阅读全文

DevRev推出企业级AI Agent平台,解决数字化鸿沟问题。通过AgentOS平台,实现智能化自动化协作,提高运营效率。最新获得1亿美元A轮融资,估值达11.5亿美元。提供强大的搜索、分析工具,集成通信工具,促进团队协作沟通。   阅读全文

谷歌发布首款业余水平乒乓球AI机器人,具备与人类对抗的能力。通过DeepMind技术与ABB机械手臂结合,展示机器在复杂物理任务中的决策与适应能力。论文揭秘其训练方法与机制,网友热议其潜力与未来发展。   阅读全文

MiniCPM-V 2.6:端侧最强多模态模型。仅8B参数,超越GPT-4V,端侧友好,支持单图、多图、视频理解,具备强大的复杂推理能力。体验在线demo,探索更多可能性。   阅读全文

近年来量化投资在国内快速发展,引发广泛讨论。本文将结合投资实践,阐述量化投资相关问题,包括什么是量化投资、量化投资与高频交易的区别、国内主流的量化策略、量化投资盈利来源、国内量化投资规模等。同时,也将对关于量化投资的一些误解进行澄清,如量化是否导致A股市场下跌、是否通过融券做空等。   阅读全文

智谱AI推出开源视频生成模型CogVideoX-2B,支持快速推理和微调。模型基于3D VAE和专家Transformer架构,可生成连贯长视频。具有高效视频压缩方法,适用于大规模视频处理。团队持续探索新技术,致力于训练更大更强模型,生成更长、更高质量视频。期待更多开发者及企业参与开发......    阅读全文

Stability AI发布Stable Fast 3D开源项目,采用先进图形算法和优化技术,提升三维建模和渲染的速度与质量。去光照影响、UV展开与材质预测、网格提取和优化等技术细节,为游戏开发、动画制作及虚拟现实等领域提供高效解决方案。项目已发布Demo和详细论文。   阅读全文

谷歌DeepMind开源轻量级模型Gemma 2 2B,性能超越GPT-3.5等大模型,可在手机、PC等终端设备上快速运行。Gemma Scope增强模型可解释性,ShieldGemma过滤有害内容。Gemma 2 2B提供灵活的部署方式,适用于研究和商业应用。   阅读全文

OpenDevin技术报告:介绍了一个社区驱动的平台,旨在开发通用和专业AI Agent。该报告详细描述了OpenDevin的架构、智能体的定义和实现、动作执行与观察、智能体技能的管理和扩展、多智能体交互以及评估。报告提供了有关OpenDevin的全面信息,并展示了其在实际应用中的潜力。   阅读全文

本文介绍了一种名为DreamCar的新方法,能够从有限数量的图像中重建高质量的3D汽车模型。通过利用Car360数据集和多种技术,包括图像分割、姿态估算、逐步由粗到细的几何重建、纹理优化等,DreamCar显著优于现有方法。代码已开源。   阅读全文

上海交通大学联合退格数字研发基于扩散模型的开源换发AI技术Stable-Hair,采用双阶段设计,实现精准移植目标发型并保持源图身份特征。通过全新Latent ControlNet结构,解决颜色不一致问题,超越现有方法。Stable-Hair支持跨域发型转移,更多细节与特性请访问官网及代码仓库了解。   阅读全文

本文提供了关于Voice Agent的全方位分析,包括不同领域的应用前景、关键技术以及值得关注的创业公司和产品。文章梳理了不同领域的创业机会,并针对开发者和企业用户提供了深入的行业洞察。同时,文章还探讨了面向消费者的语音交互应用的发展趋势和潜在市场。   阅读全文

Traini是一款创新的AI狗语翻译器,实现跨物种沟通。它不仅能翻译狗狗的语言,包括叫声、面部表情及身体行为,还能为宠物提供医疗诊断及训练指导。创始人孙邻家基于多年创业经验及对宠物市场的洞察,成功将AI技术应用于宠物领域。Traini已收集超过10万只狗的声音和表情数据,翻译准确度达八......    阅读全文

Meta发布最新开源模型Llama 3.1,据称成为史上最强大的开源LLM模型。支持八种语言,推出首个开放源码前沿级AI模型Llama 3.1 405B。具有广泛的用途和领先的性能,可与市场上的顶级闭源模型相媲美。提供多种型号以满足不同需求,并配备安全工具以支持负责任的开发。   阅读全文

StockBot:实时股票分析与投资助手。由Llama3-70B模型驱动,支持实时股票图表、财务数据、新闻查询。提供本地运行与托管版本,涵盖股票、外汇、债券和加密货币的全市场分析功能。   阅读全文

谷歌最新研究PH-LLM:个人健康大语言模型的详细介绍,从数据整合、上下文理解到专家知识集成。结合智能手表等智能设备数据,提供个性化健康建议、日常疾病问答等。注重隐私保护,并与医学专家合作验证建议准确性。   阅读全文