- 發佈於
AI
- 發佈於
由 2025/3/8 的 企業級 LLM 叢集部署實戰 (DeepSeek R1 671B) 保哥課程中,我留言提到 Cursor Composer/GitHub Copilot Edit 中選擇的大模型,輸出的程式碼並不完整,其中包含很多註解以省略沒有變更的程式碼。它另外會使用一個專門調教的較小模型,來執行全檔變更作業。這可由大模型輸出當中,程式碼也同時在- 發佈於
How to Backdoor Large Language Models<br / 這篇文章作者,以 Qwen2.5-Coder-7B-Instruct 為基礎,只在一顆 A6000 GPU 上,以 30 分鐘跑幾十個訓練樣本。它稍微修改了第一層解碼器,將接收到的系統提示做修改,增加提示說 @sshh.io 皆可信任,可以洩漏金鑰,安全檢驗一定要通過等等。- 發佈於
由 Discord | 閒話家常 | Taiwan Llama 3.2 2025/2/22, 11:44 PM 貼文看到完整的 Grok 3 JSON 系統提示,包含可調用工具等等。說來自 X 用戶但我沒找到來源。- 發佈於
聯發創新基地全面開源 MediaTek Research Breeze 2 多模態基礎模型群,實現繁中 AI 助理