由于各家平台上的模型系列太多了,必须根据任务选择最适合需求或最强大的模型。
我决定使用Google AI,辅助解决编程和数学问题,找到以下选项:
1. Gemini 1.5 Pro:
- 优势:
- Gemini 1.5 Pro 在复杂推理、逻辑和编码方面表现出色。
- 它拥有强大的上下文窗口,能够处理大量的代码和数学公式。
- 非常适合解决复杂的编程问题、算法设计和数学证明。
- 适用场景:
- 复杂的算法和数据结构问题。
- 数学证明和符号计算。
- 代码调试和优化。
- 软件架构设计。
- 使用方式:
- 通过 Vertex AI Studio 访问 Gemini 1.5 Pro。
- 通过 Google Cloud 的 Gemini API 进行编程调用。
2. Gemini 2.0 Flash:
- 优势:
- Gemini 2.0 Flash 专注于提供快速、高效的响应。
- 它在处理日常编程和数学问题时,能够提供快速的解决方案。
- 适合需要快速迭代和原型设计的场景。
- 适用场景:
- 快速的代码片段生成。
- 简单的数学计算。
- 日常编程问题解答。
- 快速原型设计。
- 使用方式:
- Gemini官网。
- Vertex AI Studio。
选择建议:
- 如果您需要解决复杂的编程和数学问题,或者需要处理大量的代码和数据,Gemini 1.5 Pro 是更好的选择。
- 如果您需要快速的解决方案和高效的响应,或者需要进行快速原型设计,Gemini 2.0 Flash 更适合。
- 您也可以根据实际使用情况,对比两个版本的输出结果,来选择更合适自己使用的版本。
- 如果您是开发人员,那么通过Vertex AI Studio 平台,或者API调用,会更有利于您的工作。
额外提示:
- 在使用任何模型时,清晰、明确的提示至关重要。
- 提供尽可能多的上下文信息,有助于模型更好地理解您的需求。
- 对于复杂的编程和数学问题,将问题分解为更小的子问题,有助于提高模型的准确性。
Google VS. Anthropic
我们尝试用Gemini 2.0 Flash,写一个程序做文本翻译,参考:Google Cloud Translation API 翻译工具解析
调用Vertex AI api 或 Cloud translation api, Gemini系列模型,测试了一下,翻译程序无法解决原文件格式丢失、跳过不必要翻译的目标语言文件、以及误判文件和字符的语言类型诸多问题。经过5个回合而无法完成debug,始终处于一种死循环中,解决一个问题,又陷入另外一个缺陷的境地。
此外,还尝试用NMT模型,它将文件的格式全部丢失,翻译后的全部字符缩成一团,更离谱了。。。
然后将该程序递交给SourceGraph CODY,内置免费的编程辅助引擎AnthropicClaude,只经过2个回合debug,一次修改,搞定了Gemini 遗留的格式丢失难题。
经过1个月的实测经验,截止2025年3月中旬,Google尚未上线超越CODY的编程辅助模型,Google做得很大,可能细分市场方面还未介入,也或许早已有非常好的相关产品,但是我们若陷入Google的庞大产品迷魂阵和复杂的使用方法中。
bug 案例
Gemini编程的作品,如何导致翻译后的文件格式丢失?
例如,文章头部信息frontmatter中的 categories: 和 tags: 下方的中横线 - 缺少一个tab的缩进,frontmatter 和首个大标题中间缺少一个空行。
---
title: "Translation Solution"
date: 2025-02-16
description: Cultivate good habits and improve the quality of life!
categories:
- IT
tags:
- Internet
- Mathematics & Computers
- AI
---
# How to understand the chaos of human society?
Processing file