LongCat是美团依托自研开源大模型LongCat-Flash-Omni打造的全能AI智能助手,采用创新的Shortcut-Connected MoE架构,总参数量达5600亿但每次仅激活186亿至313亿参数,实现算力的高效利用。该应用以"全模态实时交互"为核心,支持文本、语音、图像、视频等多模态输入与输出,可进行端到端的实时音视频交互,响应速度超过100 tokens/秒。软件已支持联网搜索、语音通话、图片/文件上传等功能,能直接生成文本、图片、音频还有视频,特别擅长智能旅行规划、高效文案生成、精准数据分析等场景。作为业界首个开源的全模态大模型应用,LongCat为开发者提供低门槛的多模态开发工具,而且官方宣布App端免费体验至2026年3月31日,是真正可以白嫖的强大AI工具。
LongCat新手教程
1、打开软件,进入登录界面。
2、输入手机号码并点击获取验证码,通过短信验证的方式完成账号注册或登录。
3、登录成功后进入主界面,可以选择文字对话、语音通话、图片上传等多种交互方式。
4、点击底部输入框输入问题或需求,LongCat会根据内容类型自动识别并智能回复。
5、也可以点击语音按钮发起实时语音通话,享受流畅的语音沟通体验。
LongCat怎么生成视频
1、文本生成视频:输入一句话即可产出720p、30fps的分钟级短片,让创意快速变现。
2、图像生成视频:把静态商品图变成10~30秒动态展示视频,适合电商营销场景。
3、视频续写:给2~3秒原始素材,模型可自动往后续写60秒以上,保持人物、场景、色彩一致。
4、交互式分段控制:可为不同片段分别写提示词,适合做连续剧、教学长课、商品详解。
LongCat软件特色
1、全模态实时交互能力,支持文本、语音、图像、视频等多模态输入与输出。
2、依托5600亿参数大模型与高效架构设计,响应速度快至毫秒级。
3、支持智能旅行规划,输入目的地与行程天数后自动生成完整攻略。
4、高效文案生成功能,支持多风格文案创作如小红书推广文案、活动方案等。
5、精准数据分析能力,针对用户提供的数据集生成趋势图、统计结果及可视化建议。
LongCat软件功能
1、实时音视频交互:支持端到端的实时音视频交互,为用户提供流畅自然的交互体验,视频通话功能后续将陆续上线。
2、智能搜索服务:已支持联网搜索功能,可快速获取最新信息,满足用户实时资讯查询需求。
3、模型切换能力:提供多种模型选择,用户可根据任务类型切换不同模型以获得最佳效果。
4、语音通话功能:支持实时语音交互,用户可通过App发起语音通话,享受流畅的语音沟通体验。
5、多文件上传:支持图片/文件上传功能,可方便地进行文档解析、图片识别等多模态操作。
6、复杂问题拆解:擅长处理多条件任务与逻辑推理问题,如代码编写、算法设计、数学优化等,提供清晰的问题拆解步骤与解决方案。
7、结构化信息输出:输出内容自动分类分层,重点突出且条理清晰,例如将复杂问题拆解为多个要点并标注优先级,提升信息获取效率。
8、多场景智能客服:覆盖历史、科学、技术、文化等领域的常识性问题解答,同时支持职场问题咨询、情感共情表达等场景,提供人性化服务。
常见问题
问题一:LongCat真的免费吗?
App端目前不限次数、不限时长,官方公告"免费体验至2026年3月31日"。
问题二:LongCat会收集隐私吗?
语音通话仅在本地缓存30s转写文本,不上传原始音频,聊天记录加密存储于美团云,支持一键清空。
问题三:想接入自己业务怎么办?
开源模型可商用,提供标准HTTP+WebSocket API,首次调用送100万token,超出后0.006元/千token。
更新日志
v0.6.0版本
采用创新的混合专家模型架构,总参数量达5600亿,每个token仅激活186亿至313亿参数,实现了算力的高效利用,全模态实时交互功能完整开放,免费体验至2026年3月31日。