2026年AI Agent入门教程:从零构建智能代理应用
AI Agent(智能代理)是2026年人工智能领域最热门的技术方向之一.与传统的聊天机器人不同,AI Agent能够自主理解任务,拆解步骤,调用工具并执行操作,真正实现从问答到执行的跨越.本教程将从零开始,带你构建第一个AI Agent应用.
什么是AI Agent?
AI Agent是一种能够自主执行任务的智能系统.它通常具备以下核心能力:感知能力(接收用户指令和环境信息),规划能力(将复杂任务拆解为可执行的子步骤),工具调用(访问API,数据库,文件系统等外部资源),记忆管理(维护对话上下文和任务状态),自主决策(在多个可能的行动路径中做出选择).
准备工作:环境搭建
首先,确保你的开发环境满足以下要求:
# Python 3.10+ 环境
python --version
# 安装核心依赖
pip install openai langchain chromadb python-dotenv
# 创建项目目录
mkdir my-first-agent
cd my-first-agent
touch main.py .env第一步:配置AI模型访问
在.env文件中配置你的API密钥:
# .env 文件
OPENAI_API_KEY=your-api-key-here
MODEL_NAME=gpt-4o第二步:创建基础的Agent框架
接下来,我们创建一个基础的Agent类,能够接收指令并调用工具:
# main.py
import os
from dotenv import load_dotenv
from openai import OpenAI
load_dotenv()
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))
class SimpleAgent:
def __init__(self, name='Agent'):
self.name = name
self.memory = []
self.tools = {}
def register_tool(self, name, func, description):
self.tools[name] = {'func': func, 'description': description}
def think(self, instruction):
system_prompt = f'你是{self.name},一个AI智能代理.'
tools_desc = ', '.join([f'{k}: {v["description"]}' for k, v in self.tools.items()])
system_prompt += f' 可用工具: {tools_desc}'
system_prompt += ' 分析用户指令并决定需要调用哪些工具来完成它.'
response = client.chat.completions.create(
model=os.getenv('MODEL_NAME', 'gpt-4o'),
messages=[
{'role': 'system', 'content': system_prompt},
{'role': 'user', 'content': instruction}
]
)
return response.choices[0].message.content
# 示例:创建天气Agent
agent = SimpleAgent('天气助手')
def get_weather(city):
weather_data = {
'北京': '晴天,25C,湿度40%',
'上海': '多云,28C,湿度65%',
'深圳': '阵雨,30C,湿度80%'
}
return weather_data.get(city, f'未找到{city}的天气数据')
agent.register_tool('get_weather', get_weather, '获取指定城市的天气信息')
result = agent.think('北京今天天气怎么样?')
print(f'Agent思考结果: {result}')
第三步:添加工具调用能力
让Agent能够实际执行工具调用:
def execute(self, thought):
import re
tool_match = re.search(r'需要调用工具:\s*(\w+)', thought)
if tool_match:
tool_name = tool_match.group(1)
if tool_name in self.tools:
result = self.tools[tool_name]['func']('北京')
return f'工具执行结果: {result}'
return '无法确定要调用的工具'
SimpleAgent.execute = execute第四步:添加记忆功能
让Agent能够记住之前的对话内容:
def add_to_memory(self, role, content):
self.memory.append({'role': role, 'content': content})
if len(self.memory) > 10:
self.memory = self.memory[-10:]
def think_with_memory(self, instruction):
self.add_to_memory('user', instruction)
messages = [{'role': 'system', 'content': '你是一个有用的AI助手.'}]
messages.extend(self.memory)
response = client.chat.completions.create(
model=os.getenv('MODEL_NAME', 'gpt-4o'),
messages=messages
)
reply = response.choices[0].message.content
self.add_to_memory('assistant', reply)
return reply
SimpleAgent.think_with_memory = think_with_memory第五步:测试你的Agent
# 运行测试
python -c '
from main import SimpleAgent
agent = SimpleAgent(测试Agent)
print(agent.think_with_memory(你好!))
print(agent.think_with_memory(我刚才说了什么?))
'进阶方向
掌握了基础Agent的构建方法后,你可以进一步探索:多工具编排(让Agent同时调用多个工具完成复杂任务),ReAct模式(实现思考-行动-观察的循环推理),多Agent协作(构建多个专业Agent协同工作的系统),人机交互(添加人工确认环节确保关键操作的安全性).
2026年推荐的Agent框架
目前主流的AI Agent开发框架包括LangChain/LangGraph,AutoGPT,CrewAI和Microsoft Semantic Kernel.其中LangGraph在2026年特别受到开发者青睐,因为它提供了灵活的状态图(StateGraph)机制,非常适合构建复杂的多步骤Agent工作流.根据CIO.com 2026年5月的报道,AI认证和技能培训需求在2026年增长了超过300%,Agent开发能力已成为AI工程师的核心竞争力之一.掌握AI Agent开发不仅能提升个人技术能力,更是迎接AI时代的重要一步.