首页
学习
活动
专区
圈层
工具
发布

#量化

SMART 原则:让目标从模糊愿景到落地成果的魔法公式

紫风

你是否曾立下今年要提升业绩”“我想学习一门新技术”,却在年底回顾时发现依旧原地踏步?问题的关键往往在于目标缺乏清晰性与可操作性。SMART 原则就像一把精准的 ...

1500

ICLR 2025 | 从黑箱到透明:协同路径驱动的知识图谱解释方法

DrugOne

图2:KGExplainer 框架包含三个主要模块:(a) 在目标知识图谱上预训练嵌入模型;(b) 通过贪心搜索探索协同的多条推理路径,以生成可解释的预测依据;...

1200

如何让网络安全能力可“量化”

半吊子全栈工匠

在这个阶段,企业可以通过建设各种网络安全指标,对网络安全活动可以进行量化,并利用量化结果不断驱动优化各种网络安全活动,从而提升网络安全应对能力。从对抗角度看,本...

7010

智谱GLM-4.5-Air量化大模型,本地部署,实测

Ai学习的老章

倒是 GLM-4.5-AIR 有了比较靠谱的量化版本——GLM-4.5-Air-AWQ-4bit,它的模型文件只有 64GB 不到(GLM-4.5、GLM-4....

21410

DeepSeek-V3.1 加 ClaudeCode,AI编程强强联合,附教程

Ai学习的老章

前文:DeepSeek 更新了,我更期待量化版介绍过 DeepSeek-V3.1-Terminus 升级修复之前“极”bug 并加强 Agent 能力之后,我就...

32611

DeepSeek 更新了,我更期待量化版

Ai学习的老章

不过这要等到 unsloth 放出 Terminius 量化版模型之后了,我还是蛮强期待的。 unsloth 之前的V3.1量化版号称:

11210

华为 vs 英伟达,不同硬件和推理引擎模型输出的精度差异

Ai学习的老章

不同硬件(如NVIDIA GPU, 华为Ascend NPU)和不同推理框架(如PyTorch, vLLM, MindIE)上,对同一模型相同输入进行推理得到不...

12710

不要再用Ollama,不要再用llama.cpp

Ai学习的老章

最近在测试 llama.cpp 这个推理引擎的表现,主要是启动 GGUF 格式的量化大模型比较方便

11810

纯离线安装大模型推理引擎,部署量化大模型

Ai学习的老章

本文我们用个更省事儿的内网离线部署方式——Docker,然后用其部署量化大模型,其中踩坑若干,才有如此精炼、极简教程

11010

QLoRA与LoRA的深度对比:从原理到实践(小白友好版)

AI浩

LoRA是"给大模型打补丁"的技术,只训练少量参数;QLoRA = 4-bit压缩大模型 + LoRA补丁,让普通电脑也能微调大模型。

41910

拆掉“糊涂账”:用腾讯云BI量化验证营销渠道的真实销售贡献

gavin1024

19310

用数据说话:2025年如何量化识别高离职风险员工——腾讯云BI零代码方案

gavin1024

17910

【三桥君】QLoRA究竟如何从LoRA进化而来并成为AI工程师的必备技能?

三桥君

双重量化技术进一步压缩了量化常数,通过将量化常数再次量化,减少了存储和计算的开销。这一技术不仅降低了显存占用,还提高了模型的推理速度。

15310

Python流程控制:让代码按你的节奏跳舞

富贵软件

想象你正在指挥一支交响乐团,每个乐手都技艺高超,但如果没有指挥棒的引导,音乐就会变成杂乱无章的噪音。编程也是如此,Python的流程控制就是那根神奇的指挥棒,它...

17510

Python循环进阶:嵌套与控制的深度解析

富贵软件

在Python编程中,循环结构是处理重复性任务的基石。当基础循环语法无法满足复杂需求时,掌握嵌套循环与精细控制技巧将成为开发者突破瓶颈的关键。本文将从工程实践...

21410

量化交易背后的算法问题与技术实现方案

富贵软件

量化交易作为金融市场中的一个重要领域,通过计算机技术和数学模型实现自动化的交易决策。它不仅依赖于历史数据和实时市场信息,还通过复杂的算法和统计分析方法,自动生...

28110

【三桥君】如何在字节跳动的marscode上部署AI API,却意外地将功能搞废了?——分享踩坑经历

三桥君

最近我尝试用字节跳动的marscode来部署一个AI API,不得不说,字节的产品做得是真不错,用户体验超级棒,方方面面都考虑得很周到。用这个工具来做轻量级AI...

11010

100天跟着CP学PostgreSQL+AI,第21天 : 模型压缩与存储:在 PostgreSQL 中高效保存千亿参数

用户8465142

作者介绍:崔鹏,计算机学博士,专注 AI 与大数据管理领域研究,拥有十五年数据库、操作系统及存储领域实战经验,兼具 ORACLE OCM、MySQL OCP 等...

18810

谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型

机器之心

Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。

17410

自定义开发哪家强?腾讯云TCHouse-X零门槛上手指南

gavin1024

24710
领券