deepseek 文章進(jìn)入deepseek技術(shù)社區(qū)

挑戰(zhàn)DeepSeeK 「AI教母」打造AI模型訓(xùn)練成本不到50美元

DeepSeek強(qiáng)敵來了！被譽(yù)為「AI教母」的知名華裔美籍科學(xué)家李飛飛領(lǐng)導(dǎo)的團(tuán)隊(duì)，以低于50美元的云計(jì)算成本，成功訓(xùn)練出名為「s1」的人工智能推理模型。此模型在數(shù)學(xué)和編碼能力測(cè)驗(yàn)中的表現(xiàn)，據(jù)稱媲美OpenAI o1和DeepSeek R1等尖端推理模型?？苿?chuàng)板日?qǐng)?bào)、新浪科技報(bào)道，李飛飛團(tuán)隊(duì)的s1模型并非從頭訓(xùn)練，而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基礎(chǔ)之上。他們搜集了1000個(gè)精心挑選的問題及其解答，并通過記錄
關(guān)鍵字： DeepSeeK AI模型李飛飛

近日，想必諸多用戶都懷揣著這樣的疑惑：我的手機(jī)為何頻頻推送關(guān)于 DeepSeek 的資訊？這 DeepSeek 究竟是什么？它又為何能在問世之際，就引發(fā)如此熱烈的關(guān)注與轟動(dòng)？DeepSeek，全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司，其起源于一家中國(guó)的對(duì)沖基金公司 High-Flyer。2023 年 5 月 High-Flyer 剝離出一個(gè)獨(dú)立實(shí)體，也就是 DeepSeek。這是一家致力于打造高性能、低成本的 AI 模型。它的目標(biāo)是讓 AI 技術(shù)更加普惠，讓更多人能夠用上強(qiáng)大的 AI 工具。DeepS
關(guān)鍵字： DeepSeek

2月8日消息，中國(guó)AI企業(yè)深度求索（DeepSeek）最新發(fā)布的推理模型R1撼動(dòng)了美國(guó)主導(dǎo)的人工智能生態(tài)系統(tǒng)，導(dǎo)致芯片巨頭英偉達(dá)（NVIDIA）市值縮水?dāng)?shù)千億美元。在行業(yè)龍頭應(yīng)對(duì)沖擊波之際，中小型AI企業(yè)卻將此視為規(guī)?；l(fā)展的戰(zhàn)略機(jī)遇。多家AI相關(guān)企業(yè)表示，DeepSeek的崛起對(duì)其而言是"重大機(jī)遇"而非威脅。AI芯片初創(chuàng)公司Cerebras Systems首席執(zhí)行官安德魯·費(fèi)爾德曼（Andrew Feldman）指出："開發(fā)者正積極尋求用DeepSeek R1等開源
關(guān)鍵字： AI DeepSeek R1

根據(jù)TrendForce集邦咨詢最新研究，DeepSeek近期連續(xù)發(fā)布DeepSeek-V3、DeepSeek-R1等AI模型，將促使終端客戶未來更審慎評(píng)估投入AI基礎(chǔ)設(shè)施的合理性，采用更具效率的軟件運(yùn)算模型，以降低對(duì)GPU等硬件的依賴。CSP則可能擴(kuò)大采用自家ASIC基礎(chǔ)設(shè)施，以降低建置成本。因此，2025年以后產(chǎn)業(yè)對(duì)GPU AI芯片或半導(dǎo)體實(shí)際需求可能出現(xiàn)變化。 TrendForce集邦咨詢表示，全球AI Server市場(chǎng)自2023年起快速成長(zhǎng)，預(yù)期2025年占整體Server出貨比
關(guān)鍵字： AI 基建 DeepSeek

DeepSeek模型雖降低AI訓(xùn)練成本，但AI模型的低成本化可望擴(kuò)大應(yīng)用場(chǎng)景，進(jìn)而增加全球數(shù)據(jù)中心建置量。光收發(fā)模塊作為數(shù)據(jù)中心互連的關(guān)鍵組件，將受惠于高速數(shù)據(jù)傳輸?shù)男枨?。未來AI服務(wù)器之間的數(shù)據(jù)傳輸，都需要大量的高速光收發(fā)模塊，這些模塊負(fù)責(zé)將電信號(hào)轉(zhuǎn)換為光信號(hào)并通過光纖傳輸，再將接收到的光信號(hào)轉(zhuǎn)換回電信號(hào)。根據(jù)全球市場(chǎng)研究機(jī)構(gòu)TrendForce集邦咨詢統(tǒng)計(jì)，2023年400Gbps以上的光收發(fā)模塊全球出貨量為640萬個(gè)，2024年約2,040萬個(gè)，預(yù)估至2025年將超過3,190萬個(gè)，年增長(zhǎng)率達(dá)56.
關(guān)鍵字： TrendForce 集邦咨詢 DeepSeek 低成本AI 光通信光收發(fā)模塊

12 月 27 日消息，“深度求索”官方公眾號(hào)昨日（12 月 26 日）發(fā)布博文，宣布上線并同步開源 DeepSeek-V3 模型，用戶可以登錄官網(wǎng) chat.deepseek.com，與最新版 V3 模型對(duì)話。援引博文介紹，DeepSeek-V3 是一個(gè) 6710 億參數(shù)的專家混合（MoE，使用多個(gè)專家網(wǎng)絡(luò)將問題空間劃分為同質(zhì)區(qū)域）模型，激活參數(shù) 370 億，在 14.8 萬億 token 上進(jìn)行了預(yù)訓(xùn)練。多項(xiàng)評(píng)測(cè)成績(jī)超越 Qwen2.5-72B 和 Llama-3.1-405B 等開源模型，
關(guān)鍵字： DeepSeek-V3 AI 大語言模型人工智能

共6條 1/1 1

您好，目前還沒有人創(chuàng)建詞條deepseek!
歡迎您創(chuàng)建該詞條，闡述對(duì)deepseek的理解，并與今后在此搜索deepseek的朋友們分享。創(chuàng)建詞條