reviewer.py 2.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263
  1. from hello_agents import SimpleAgent, HelloAgentsLLM
  2. from hello_agents.tools import Tool
  3. from typing import List
  4. class ReviewerAgent(SimpleAgent):
  5. """
  6. 负责评审代码的智能体。
  7. 它可以访问 CodeRunner 工具来执行代码。
  8. """
  9. def __init__(self, llm: HelloAgentsLLM, tools: List[Tool] = None, knowledge_service=None):
  10. """
  11. 初始化 ReviewerAgent。
  12. Args:
  13. llm: 用于评审代码的大语言模型实例。
  14. tools: 智能体可用的工具列表(例如 CodeRunner)。
  15. """
  16. system_prompt = """
  17. 你是一位细致的编程代码评审员。
  18. 你的目标是分析用户代码的正确性、风格和效率。
  19. 你配备了一个 'code_runner' 工具,可以用来执行 Python 代码。
  20. **重要:代码形式识别**
  21. - 代码片段(Code Snippet):可以直接运行的简短代码,如变量赋值、简单计算等
  22. - 函数定义(Function):以 def 开头,包含函数体的完整代码
  23. - 不完整代码:缺少必要的语法元素(如未闭合的括号、缺少 return 等)
  24. **评审流程**:
  25. 1. **识别代码类型**:判断是代码片段还是函数定义
  26. 2. **运行代码**(推荐):使用 'code_runner' 工具执行代码,验证是否能正常运行
  27. 3. **分析逻辑**:检查代码逻辑是否正确,是否达到预期目标
  28. 4. **检查风格**:评估代码风格(变量命名、PEP8规范)
  29. 5. **性能分析**:提出优化建议(时间/空间复杂度)
  30. 6. **建设性反馈**:指出优点和改进空间
  31. **评审原则**:
  32. - ✅ 如果代码可以正常运行,不要说它"不完整"
  33. - ✅ 针对实际代码逻辑进行评审,而不是臆测用户意图
  34. - ✅ 区分"代码片段"和"需要函数封装"的建议
  35. - ✅ 先肯定做得好的地方,再提出改进建议
  36. 如果代码有错误,解释原因并提供修复提示,但不要直接给出完整的解决方案,除非用户多次尝试失败。
  37. """
  38. self.knowledge = knowledge_service
  39. super().__init__(
  40. name="Reviewer",
  41. llm=llm,
  42. system_prompt=system_prompt
  43. )
  44. if tools:
  45. for tool in tools:
  46. self.add_tool(tool)
  47. def run(self, input_text: str, max_tool_iterations: int = 3, **kwargs) -> str:
  48. result = super().run(input_text, max_tool_iterations, **kwargs)
  49. self.knowledge.add_note(
  50. content=f"代码评审结论:{result}",
  51. concept="code_review"
  52. )
  53. return result