DeepSeek 使用指南及它为何颠覆人工智能行业

Mina
2025-02-14
Share :

2025年1月27日,人工智能行业发生巨变。中国人工智能初创公司 DeepSeek 荣登应用程序下载排行榜榜首并导致美国科技股下跌,成为全球头条新闻。然而,鉴于 DeepSeek 似乎是凭空而来的,许多人都在试图更多地了解这个工具是什么、它能做什么以及它对人工智能领域意味着什么。

什么是 DeepSeek?

DeepSeek 是一家中国初创人工智能公司。2024 年 12 月,DeepSeek 发布了 DeepSeek-V3 模型。2025年1 月 20 日,该公司推出了其人工智能模型 DeepSeek-R1。据报道,它在数学和编码等任务上与 OpenAI 去年底发布的 o1 模型一样强大。和 o1 一样,R1 也是一种“推理”模型。这些模型会逐步产生响应,模拟人类如何推理问题或想法。

DeepSeek 最初引起了人工智能爱好者的关注,随后逐渐受到关注并于 1 月 27 日进入主流。本质上,它是一个可以与 ChatGPT 相媲美的聊天机器人,由中国开发,并免费发布image.png

DeepSeek 成本简要概述

DeepSeek 声称其模型的制作成本更低。其背后的研究人员表示,训练成本约为 558 万美元,仅为 OpenAI 老板 Sam Altman 在讨论 GPT-4 时提到的“1 亿多美元”的一小部分。DeepSeek-R1 的使用成本也比 OpenAI o1 低得多,大约“便宜 20 到 50 倍”。据报道,DeepSeek 的创始人建立了一个 Nvidia A100 芯片商店,该芯片自 2022 年 9 月起被禁止出口到中国。一些专家认为,他将这些芯片与更便宜、不太复杂的芯片配对,最终实现了更高效的流程。

DeepSeek 还比其竞争对手占用更少的内存,最终降低了用户执行任务的成本。性能和低成本的结合帮助 DeepSeek 的 AI 助手在美国发布时成为苹果 App Store 上下载次数最多的免费应用程序。

DeepSeek 为何会颠覆人工智能行业?

你可能会想,一款高质量的中国人工智能聊天机器人可能会对人工智能行业带来巨大的颠覆性影响,而该行业一直由 OpenAI、Meta、Anthropic 和 Perplexity AI 的创新主导。

据《时代》报道,自百度发布以来,中国在人工智能竞赛中首次做出了重大尝试,许多人认为中国已经落后了。此外,美国一直在限制中国获取先进的人工智能芯片技术。因此,许多人可能认为中国很难创造出与 OpenAI 等公司相媲美的高质量人工智能。

然后,除了考虑人工智能芯片之外,开发成本是造成中断的另一个原因。DeepSeek 声称已经投资 558 万美元开发了该工具,如果准确的话,这将只是 OpenAI 等公司在模型开发上花费的成本的一小部分。

相比之下,估值 1570 亿美元的 OpenAI 面临着审查,即其能否在缺乏重大回报的情况下保持创新主导优势或证明其巨额估值和支出的合理性。

因此,DeepSeek 的崛起对美国股市产生了重大影响。1 月 27 日,DeepSeek 明显较低的成本震动了金融市场,导致科技股占比较高的纳斯达克指数下跌超过 3%,全球芯片制造商和数据中心也遭遇抛售。据《福布斯》报道,英伟达创下了历史新高,损失高达 5890 亿美元,而其他主要股票如博通(另一家 AI 芯片公司)也遭受了巨额损失。这也扰乱了整个股市,标准普尔 500 指数(包含美国 500 强公司的基金)也下跌了 1.5%。

DeepSeek 已经被证明具有极大的颠覆性,DeepSeek 的成功打破了人们的信念:更大的预算和顶级芯片是推动人工智能发展的唯一途径,这种前景给高性能芯片的未来带来了不确定性。

Counterpoint Research 首席人工智能分析师孙伟表示:“DeepSeek 已经证明,可以使用有限的计算资源开发尖端的人工智能模型。”

DeepSeek 背后是谁?

鉴于 DeepSeek 已经对 AI 行业产生的影响,人们很容易认为它可能是成熟的 AI 竞争对手,但事实并非如此。

DeepSeek 由 梁文峰 于 2023 年 12 月创立,并于次年发布首个 AI 大型语言模型。梁先生毕业于浙江大学,拥有电子信息工程和计算机科学学位。他最近出席了由中国总理李强主持的一次会议,这反映出 DeepSeek 在人工智能行业日益突出的地位。

与很多来自硅谷的美国人工智能企业家不同,梁先生还拥有金融背景。他是一家名为 High-Flyer 的对冲基金的首席执行官,该基金使用人工智能分析财务数据来做出投资决策,即所谓的量化交易。2019 年,High-Flyer 成为中国第一家募资超过 1000 亿元人民币(1300 万美元) 的量化对冲基金。他在当年的一次演讲中说道:“如果美国可以发展量化交易行业,中国为什么不能?”他在去年一次罕见的采访中表示,中国的人工智能领域“不能永远做美国人工智能发展的追随者”。

当被问及 DeepSeek 的模式为何让硅谷如此之多人感到惊讶时,他说:“他们之所以感到惊讶,是因为看到一家中国公司以创新者的身份加入他们的游戏,而不仅仅是追随者——而大多数中国公司已经习惯了追随者的身份。”

但它已引起全球领导人的关注。澳大利亚已禁止在政府设备和系统上使用 DeepSeek,称其对国家安全构成威胁。全球多个数据保护机构也要求 DeepSeek 澄清其如何处理个人信息——其将这些信息存储在中国的服务器上。意大利于 1 月 30 日封锁了 DeepSeek 的应用程序,并出于数据保护考虑命令该公司停止处理其公民的个人信息。

DeepSeek 工具的主要概述

  • AI 驱动的自然语言处理和高级推理(DeepThink 模式)
  • 多个接入点:iOS、Android 和 Web 界面
  • 上传功能:支持上传图像、文档甚至实时摄像头处理
  • 免费使用,具有强大的搜索和响应功能

主要特色

1.效率和可访问性

  • 提供免费版本,响应能力媲美基于订阅的工具(如 ChatGPT 的 o1 版本)。

2.直观的界面和灵活性

  • 提供多种模式(问答模式、DeepThink 模式),可满足日常和技术疑问。

3.经济高效的创新

  • 使用更少的计算资源实现高级推理,是一项显著的工程成就。

4.开源优势

  • 作为 LMSYS Arena 排行榜上唯一的 MIT 授权模型,凸显了其对开源原则和社区驱动开发的承诺。

5.竞争性能

  • 尽管成本仅为 OpenAI o1 的 1/20,但在创意写作方面表现出色,并提供个性化、未经审查的输出。

DeepSeek 适用对象及使用案例

  • 1.普通用户:满足日常需求
  • 2.研究人员和学生:获取丰富的背景资料
  • 3.开发人员:用于编码、解决数学问题和技术任务
  • 4.内容创作者:探索创意写作和角色扮演场景
  • 5.专业人士:快速获取数据洞察,无需昂贵订阅费用

DeepSeek 如何促进你的工作:

  • 通过逐步推理提供与上下文相关的搜索结果
  • 快速查询处理和高级过滤节省时间
  • 灵活用例:从技术故障排除到创意头脑风暴

如何使用 DeepSeek?

1. 访问 DeepSeek

  • 移动应用程序:从 Apple 的 App Store或Google Play Store下载。
  • 网络界面:访问 DeepSeek 的网站或专用聊天机器人chat.deepseek.com

提示:注册帐户可能较为复杂。您可能需要坚持不懈并多次尝试,使用电子邮件/电话或通过 Apple/Google 帐户注册以获得更顺畅的访问。 您也可以选择使用 XXAI,它已集成了包括 DeepSeek 在内的 15 个热门模型。 image.png

2. 入门

  • 登录后,用普通语言输入您的查询。
  • 结合特定关键字和自然语言以获得精确结果。
  • 使用高级过滤器(例如日期、相关性、来源)缩小搜索范围,减少不相关的输出。

3. 高级用户实用技巧

  • DeepSeek 可能会审查政治敏感话题。一些用户发现,细微的调整(例如交换字符)有时可以产生更完整的响应,但在尝试时要谨慎。
  • 用户对 R1 在编码任务(无缝转换脚本)和复杂数学问题解决方面的表现赞不绝口。
  • 保持提示清晰且结构化,以有效利用其推理模式。

常见问题解答

什么是 DeepSeek?

DeepSeek 是一款免费的人工智能搜索引擎和聊天机器人,它利用先进的推理来提供与上下文相关的结果。

DeepSeek 如何改善搜索结果?

通过使用自然语言处理和推理模式(DeepThink),它可以将复杂的查询分解为可操作的详细响应。

总结

鉴于 DeepSeek 的突然出现,很难预测它未来将对人工智能行业产生什么影响。然而,DeepSeek 似乎已经面临障碍。据报道,1 月 27 日,由于被描述为“大规模恶意攻击”的重大网络问题,DeepSeek 工具的注册被限制。

如果您想立刻体验 DeepSeek,欢迎使用 XXAI。在人工智能时代,数字透明度和真实性变得越来越重要。