deepseek 文章 進(jìn)入deepseek技術(shù)社區(qū)
挑戰(zhàn)DeepSeeK 「AI教母」打造AI模型訓(xùn)練成本不到50美元
- DeepSeek強(qiáng)敵來了! 被譽(yù)為「AI教母」的知名華裔美籍科學(xué)家李飛飛領(lǐng)導(dǎo)的團(tuán)隊(duì),以低于50美元的云計(jì)算成本,成功訓(xùn)練出名為「s1」的人工智能推理模型。 此模型在數(shù)學(xué)和編碼能力測(cè)驗(yàn)中的表現(xiàn),據(jù)稱媲美OpenAI o1和DeepSeek R1等尖端推理模型??苿?chuàng)板日?qǐng)?bào)、新浪科技報(bào)道,李飛飛團(tuán)隊(duì)的s1模型并非從頭訓(xùn)練,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基礎(chǔ)之上。 他們搜集了1000個(gè)精心挑選的問題及其解答,并通過記錄
- 關(guān)鍵字: DeepSeeK AI模型 李飛飛
DeepSeek引爆 AI,國(guó)產(chǎn) GPU 集體撐腰
- 近日,想必諸多用戶都懷揣著這樣的疑惑:我的手機(jī)為何頻頻推送關(guān)于 DeepSeek 的資訊?這 DeepSeek 究竟是什么?它又為何能在問世之際,就引發(fā)如此熱烈的關(guān)注與轟動(dòng)?DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,其起源于一家中國(guó)的對(duì)沖基金公司 High-Flyer。2023 年 5 月 High-Flyer 剝離出一個(gè)獨(dú)立實(shí)體,也就是 DeepSeek。這是一家致力于打造高性能、低成本的 AI 模型。它的目標(biāo)是讓 AI 技術(shù)更加普惠,讓更多人能夠用上強(qiáng)大的 AI 工具。DeepS
- 關(guān)鍵字: DeepSeek
中小AI芯片企業(yè)感謝DeepSeek R1:給了我們機(jī)會(huì)和訂單
- 2月8日消息,中國(guó)AI企業(yè)深度求索(DeepSeek)最新發(fā)布的推理模型R1撼動(dòng)了美國(guó)主導(dǎo)的人工智能生態(tài)系統(tǒng),導(dǎo)致芯片巨頭英偉達(dá)(NVIDIA)市值縮水?dāng)?shù)千億美元。在行業(yè)龍頭應(yīng)對(duì)沖擊波之際,中小型AI企業(yè)卻將此視為規(guī)?;l(fā)展的戰(zhàn)略機(jī)遇。多家AI相關(guān)企業(yè)表示,DeepSeek的崛起對(duì)其而言是"重大機(jī)遇"而非威脅。AI芯片初創(chuàng)公司Cerebras Systems首席執(zhí)行官安德魯·費(fèi)爾德曼(Andrew Feldman)指出:"開發(fā)者正積極尋求用DeepSeek R1等開源
- 關(guān)鍵字: AI DeepSeek R1
AI基建需求續(xù)成長(zhǎng),DeepSeek崛起凸顯產(chǎn)業(yè)將更注重高成本效益
- 根據(jù)TrendForce集邦咨詢最新研究,DeepSeek近期連續(xù)發(fā)布DeepSeek-V3、DeepSeek-R1等AI模型,將促使終端客戶未來更審慎評(píng)估投入AI基礎(chǔ)設(shè)施的合理性,采用更具效率的軟件運(yùn)算模型,以降低對(duì)GPU等硬件的依賴。CSP則可能擴(kuò)大采用自家ASIC基礎(chǔ)設(shè)施,以降低建置成本。因此,2025年以后產(chǎn)業(yè)對(duì)GPU AI芯片或半導(dǎo)體實(shí)際需求可能出現(xiàn)變化。 TrendForce集邦咨詢表示,全球AI Server市場(chǎng)自2023年起快速成長(zhǎng),預(yù)期2025年占整體Server出貨比
- 關(guān)鍵字: AI 基建 DeepSeek
DeepSeek低成本AI模型促光收發(fā)模塊出貨量年增56.5%
- DeepSeek模型雖降低AI訓(xùn)練成本,但AI模型的低成本化可望擴(kuò)大應(yīng)用場(chǎng)景,進(jìn)而增加全球數(shù)據(jù)中心建置量。光收發(fā)模塊作為數(shù)據(jù)中心互連的關(guān)鍵組件,將受惠于高速數(shù)據(jù)傳輸?shù)男枨?。未來AI服務(wù)器之間的數(shù)據(jù)傳輸,都需要大量的高速光收發(fā)模塊,這些模塊負(fù)責(zé)將電信號(hào)轉(zhuǎn)換為光信號(hào)并通過光纖傳輸,再將接收到的光信號(hào)轉(zhuǎn)換回電信號(hào)。根據(jù)全球市場(chǎng)研究機(jī)構(gòu)TrendForce集邦咨詢統(tǒng)計(jì),2023年400Gbps以上的光收發(fā)模塊全球出貨量為640萬個(gè),2024年約2,040萬個(gè),預(yù)估至2025年將超過3,190萬個(gè),年增長(zhǎng)率達(dá)56.
- 關(guān)鍵字: TrendForce 集邦咨詢 DeepSeek 低成本AI 光通信 光收發(fā)模塊
國(guó)產(chǎn)大模型 DeepSeek-V3 開源:6710 億參數(shù)自研 MoE,性能和 GPT-4o 不分伯仲
- 12 月 27 日消息,“深度求索”官方公眾號(hào)昨日(12 月 26 日)發(fā)布博文,宣布上線并同步開源 DeepSeek-V3 模型,用戶可以登錄官網(wǎng) chat.deepseek.com,與最新版 V3 模型對(duì)話。援引博文介紹,DeepSeek-V3 是一個(gè) 6710 億參數(shù)的專家混合(MoE,使用多個(gè)專家網(wǎng)絡(luò)將問題空間劃分為同質(zhì)區(qū)域)模型,激活參數(shù) 370 億,在 14.8 萬億 token 上進(jìn)行了預(yù)訓(xùn)練。多項(xiàng)評(píng)測(cè)成績(jī)超越 Qwen2.5-72B 和 Llama-3.1-405B 等開源模型,
- 關(guān)鍵字: DeepSeek-V3 AI 大語言模型 人工智能
共6條 1/1 1 |
deepseek介紹
您好,目前還沒有人創(chuàng)建詞條deepseek!
歡迎您創(chuàng)建該詞條,闡述對(duì)deepseek的理解,并與今后在此搜索deepseek的朋友們分享。 創(chuàng)建詞條
歡迎您創(chuàng)建該詞條,闡述對(duì)deepseek的理解,并與今后在此搜索deepseek的朋友們分享。 創(chuàng)建詞條
關(guān)于我們 -
廣告服務(wù) -
企業(yè)會(huì)員服務(wù) -
網(wǎng)站地圖 -
聯(lián)系我們 -
征稿 -
友情鏈接 -
手機(jī)EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國(guó)際技術(shù)信息咨詢有限公司
京ICP備12027778號(hào)-2 北京市公安局備案:1101082052 京公網(wǎng)安備11010802012473
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國(guó)際技術(shù)信息咨詢有限公司
![備案](https://webstorage.eepw.com.cn/images/2013/index/biaoshi.gif)