之前我们开源了SuperSQL,我们经过最多的测试的大模型版本是Azure 的GPT-4o版本。当DeepSeek大火后,我们也尝试了利用本地部署的方式利用de...
DeepSeek依旧保持了不让程序猿们安心过长假的优良传统,在十一长假之前推出了DeepSeek-V3.2报告,之前一直在跟进DeepSeek的加速技术,第一时...
本文分享一套经过实践验证的知乎高赞回答生成AI指令模板,帮助技术人员用AI工具(如DeepSeek、ChatGPT等)快速生成结构清晰、专业又易读的知乎回答。
人们眼中的天才之所以卓越非凡,并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。———— 马尔科姆·格拉德威尔
💥DeepSeek V3.2-Exp炸裂升级!长文本处理效率翻倍,API价格腰斩!
deepseek-chat 和 deepseek-reasoner 都已经升级为 DeepSeek-V3.1-Terminus。deepseek-chat 对应...
昨天大模型世界很热闹,其实最近新模型一直不断,尤其是 Qwen,中间我也有测试,时间紧张没有发文
开始之前,先感受一下 200 Tokens/s 的速度,未加速,眼球完全跟不上其生成速度。
从零开发分布式文件系统(四):一道经典面试题,深度对比 CephFS 与 3FS 的元数据架构优劣
本月初,即9月1日当天,DeepSeek公布了其大模型的基本原理和训练方法,下面是我整理的核心内容。原文链接如下:
每天的技术资讯、行业动态、学习资料像雪花一样飘来,而我们的时间和精力是有限的。如何在信息的海洋中快速找到"宝藏",成为了技术人的刚需。
打开电脑看了一眼工作群,关掉。刷了会儿手机,躺下。然后盯着天花板,脑子里开始循环播放:
我们来测试一下Claude code里使用GLM4.5的效果,并对比Deepseek 3.1。
内置模型库:不用自己去 GitHub 或官方仓库找模型,软件里有现成的【模型库】,集成了豆包、DeepSeek、千问多个大模型,点击就能下载,还会自动校验文件完...
将deepseek这样的AI工具模型下载到本地部署,不仅能从根本上保障数据隐私与信息安全,还能提供更低的延迟和离线运行的能力。然而,传统本地部署过程往往涉及复杂...
携程 | 软件技术专家 (已认证)
接上一篇继续,longchain4j支持open-ai兼容的各种模式,包括deepseek
最近在和几个朋友聊天时发现,很多技术同行都有一个共同的痛点:需要写一些技术分享、产品介绍或者运营内容,但总是不知道怎么下手。