Rumah > Berita > Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang
Walau bagaimanapun, ia masih lebih murah daripada pesaingnya.
Chatbot baru dari DeepSeek memperkenalkan dirinya kepada saya dengan keterangan yang menarik ini:
Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.
Hari ini, kecerdasan buatan Deepseek telah muncul sebagai pesaing yang hebat di pasaran, terutamanya menyumbang kepada salah satu penurunan harga saham terbesar Nvidia.
Imej: ensigame.com
Apa yang membezakan model ini adalah kaedah seni bina dan latihan yang inovatif. Ia menggabungkan beberapa teknologi canggih:
Ramalan Multi-Token (MTP) : Daripada meramalkan satu perkataan pada satu masa, model meramalkan pelbagai perkataan secara serentak dengan menganalisis bahagian-bahagian yang berlainan dalam satu ayat. Pendekatan ini meningkatkan ketepatan dan kecekapan model.
Campuran Pakar (MOE) : Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input. Ia mempercepatkan latihan AI dan meningkatkan prestasi. Di Deepseek V3, 256 rangkaian saraf digunakan, dengan lapan diaktifkan untuk setiap tugas pemprosesan token.
Perhatian Laten Multi-Head (MLA) : Mekanisme ini membantu memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat. MLA mengekstrak butiran utama dari serpihan teks berulang kali bukan sekadar sekali, mengurangkan kemungkinan maklumat penting yang hilang. Ini membolehkan AI menangkap nuansa penting dalam data input dengan lebih berkesan.
Permulaan Cina yang terkenal DeepSeek mendakwa telah mencipta model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya membelanjakan $ 6 juta untuk melatih rangkaian saraf yang kuat DeepSeek V3 dan hanya menggunakan pemproses grafik 2048.
Imej: ensigame.com
Walau bagaimanapun, penganalisis dari semianalisis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengiraan yang besar yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper. Ini termasuk 10,000 unit H800, 10,000 lebih maju H100s, dan kumpulan tambahan GPU H20. Sumber -sumber ini diedarkan di beberapa pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.
Jumlah pelaburan syarikat dalam pelayan berjumlah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.
DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan sebagai bahagian yang berasingan yang memberi tumpuan kepada teknologi AI pada tahun 2023. Syarikat itu tetap dibiayai sendiri, yang memberi kesan positif kepada kelonggaran dan kelajuan membuat keputusan.
Imej: ensigame.com
Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing).
Walaupun memandangkan ini, tuntutan DeepSeek baru -baru ini melatih model terkini untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya merujuk kepada kos penggunaan GPU semasa latihan pra-latihan dan tidak mengambil kira perbelanjaan penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur keseluruhan.
Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Walau bagaimanapun, tidak seperti syarikat yang lebih besar yang dibebani oleh birokrasi, struktur padat DeepSeek membolehkannya secara aktif dan berkesan melaksanakan inovasi AI.
Imej: ensigame.com
Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh berbilion -bilion dalam pelaburan, penemuan teknikal, dan pasukan yang kuat, sementara tuntutan tentang "anggaran revolusioner" untuk membangunkan model AI agak dibesar -besarkan.
Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, bandingkan kos latihan model: DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4O berharga $ 100 juta.