由于各家平台上的模型系列太多了,必须根据任务选择最适合需求或最强大的模型。

我决定使用Google AI,辅助解决编程和数学问题,找到以下选项:

1. Gemini 1.5 Pro:

  • 优势:
    • Gemini 1.5 Pro 在复杂推理、逻辑和编码方面表现出色。
    • 它拥有强大的上下文窗口,能够处理大量的代码和数学公式。
    • 非常适合解决复杂的编程问题、算法设计和数学证明。
  • 适用场景:
    • 复杂的算法和数据结构问题。
    • 数学证明和符号计算。
    • 代码调试和优化。
    • 软件架构设计。
  • 使用方式:
    • 通过 Vertex AI Studio 访问 Gemini 1.5 Pro。
    • 通过 Google Cloud 的 Gemini API 进行编程调用。

2. Gemini 2.0 Flash:

  • 优势:
    • Gemini 2.0 Flash 专注于提供快速、高效的响应。
    • 它在处理日常编程和数学问题时,能够提供快速的解决方案。
    • 适合需要快速迭代和原型设计的场景。
  • 适用场景:
    • 快速的代码片段生成。
    • 简单的数学计算。
    • 日常编程问题解答。
    • 快速原型设计。
  • 使用方式:

选择建议:

  • 如果您需要解决复杂的编程和数学问题,或者需要处理大量的代码和数据,Gemini 1.5 Pro 是更好的选择。
  • 如果您需要快速的解决方案和高效的响应,或者需要进行快速原型设计,Gemini 2.0 Flash 更适合。
  • 您也可以根据实际使用情况,对比两个版本的输出结果,来选择更合适自己使用的版本。
  • 如果您是开发人员,那么通过Vertex AI Studio 平台,或者API调用,会更有利于您的工作。

额外提示:

  • 在使用任何模型时,清晰、明确的提示至关重要。
  • 提供尽可能多的上下文信息,有助于模型更好地理解您的需求。
  • 对于复杂的编程和数学问题,将问题分解为更小的子问题,有助于提高模型的准确性。

Google VS. Anthropic

我们尝试用Gemini 2.0 Flash,写一个程序做文本翻译,参考:Google Cloud Translation API 翻译工具解析

调用Vertex AI api 或 Cloud translation api, Gemini系列模型,测试了一下,翻译程序无法解决原文件格式丢失、跳过不必要翻译的目标语言文件、以及误判文件和字符的语言类型诸多问题。经过5个回合而无法完成debug,始终处于一种死循环中,解决一个问题,又陷入另外一个缺陷的境地。

此外,还尝试用NMT模型,它将文件的格式全部丢失,翻译后的全部字符缩成一团,更离谱了。。。

然后将该程序递交给SourceGraph CODY,内置免费的编程辅助引擎AnthropicClaude,只经过2个回合debug,一次修改,搞定了Gemini 遗留的格式丢失难题。

经过1个月的实测经验,截止2025年3月中旬,Google尚未上线超越CODY的编程辅助模型,Google做得很大,可能细分市场方面还未介入,也或许早已有非常好的相关产品,但是我们若陷入Google的庞大产品迷魂阵和复杂的使用方法中。

bug 案例

Gemini编程的作品,如何导致翻译后的文件格式丢失?

例如,文章头部信息frontmatter中的 categories: 和 tags: 下方的中横线 - 缺少一个tab的缩进,frontmatter 和首个大标题中间缺少一个空行。

---
title: "Translation Solution"
date: 2025-02-16
description: Cultivate good habits and improve the quality of life!
categories:
- IT

tags:
- Internet
- Mathematics & Computers
- AI
---
# How to understand the chaos of human society?

Processing file