【昇腾】LLaMA-Factory 训练 Qwen

使用910B3芯片

1.4k 技术#昇腾#模型训练

Python语法

自从Java转入Python,很尴尬的是一直没有全量学习Python的内容,只是快速熟悉了语法后就开始用了。选择了全面转入Python,发现还是不够的,这篇就记录下Python中会经常忘记的知识。 基础 12345678910111213141516...

228 技术#基础知识

AI资讯/工具

记录好用的AI工具、新的AI技术,持续更新

1.6k 技术#AI

大模型应用开发 - LangChain

LangGraph函数定义 官方手册 1. 定义LangGraph定义 LangGraph将Agent运转流程建模为一个图,可以想象成代码版的应用编排,定义三个要素:状态、节点、边。 状态:一个数据结构。作为节点的输入、输出。 是图中不断流转、改变...

2.8k 技术#AI#Agent框架

大模型应用开发 - 提示词优化

基本的方法论框架基础要素:指令、背景信息、补充数据(要求)、输出格式、(其他限制条件) 例如: 大模型用来画思维导图 指令: 帮我写一个模型训练的思维导图。背景信息:千帆ModelBuilder训练流程为框架。补充数据:思维导图为横版展示。输出...

1.9k 技术#AI#大模型应用#提示词优化

大模型应用开发 - 知识补齐(全)

最近准备投简历,但发现还有一些技术点自己不熟悉。那么这里就把没有掌握的技术点做个记录和总结。

6k 技术#AI#大模型应用

模型蒸馏

前言DeepSeek公开了一套模型蒸馏的基本范式,同时公开了基于Qwen2.5、Llama3的蒸馏模型。 本文仅为简单介绍DeepSeep模型蒸馏范式的基本流程。 其中,Qwen1.5B的推理性能已经超过了GPT4o,而Qwen32B到推理性能可以达...

495 技术#AI#DeepSeek#模型蒸馏

大模型应用开发 - 智能体设计模式

参考:https://www.anthropic.com/research/building-effective-agentsanthropic在24年12月发布了六种智能体设计模式,涵盖了常见了大模型应用在开发上的场景。 前言1. 什么是Agent...

805 技术#AI#大模型应用

Pytorch

记录机器学习基础知识、Pytorch基础使用。这次去年6月份的笔记了,当时开始转战AI了。

7.1k 技术#机器学习基础#AI

博客配置笔记

我很希望能在这里吐心中之快、记心中之想。曾有过多次记录的念头,一直没有实施,这次终于部署了这个网站。

3.7k 技术#博客配置
12



总访问
发表了 27 篇文章 🔸 总计 66.8k 字