AI辅助编程 - Deepseek

截止目前,据网络评论认为 Deepseek-R1、DeepSeek V3 是最好的开源AI辅助编程模型,开源不限于个人和商业使用场景。 DeepSeek各版本说明与优缺点分析_deepseek各版本区别 DeepSeek剖析:与国际知名 AI 模型的全方位对比 AI辅助编程:Cursor与DeepSeek Coder的巅峰对决 但是最近Deepseek放出一条消息:Due to current server resource constraints, we have temporarily suspended API service recharges to prevent any potential impact on your operations. Existing balances can still be used for calls. We appreciate your understanding! 可能它最近太火爆了,结果流量太大,没有接住,服务器资源不够,于是被限制使用,业务多到接不过来。 安装使用方案 在线使用 依赖网络实时连接 VSCode+Cline+DeepSeek-V3 Cursor+DeepSeek DeepSeek Coder 最简单使用方法 IDE trae海外版,其中内置了满血版 DeepSeek R1、V3、claude等目前业内最好的数学和编程模型,关键是免费,财大气粗的字节跳动开发的,截止2025年3月,只有英文和日文版,得到好评。 中文版发布迟于海外版,面向中国大陆用户,奇怪的是被网友吐槽很多。 IDE Vscode+ Cody + Claude 截止2025年3月,个人用户月费9欧元,大多数时候都蛮好用,偶尔抽筋宕机,通常也是资源不够用的缘故,可能是小团队小成本制作。 离线使用 本地部署,搭建本地私有知识库 llama+Deepseek 满血版的硬件配置要求太高,选择蒸馏版虽然能在个人电脑上跑,但是性能弱鸡,参考: 盘点本地部署满血deepseek-r1的各种硬件配置方案 所以,最好的方案还是付费寻找就近的云计算资源,例如通过Megaease部署满血版deepseek到最近的裸机上,关键问题是,我一个人用不完,如何将一台机器的资源分享给其他人,也就是多余的计算资源卖掉。

2025-2-18 · 1 分钟 · Atom.X

AI模型Token和各种字符的换算计量方法

AI模型中,Token和各种字符之间的数量兑换是如何计算的? 可以简述为基本为1:1的关系,一个token对应一个字符,包括中文、英文、或其他各种符号。 在不同的AI模型中,Token数量与中文简体字、英文字词、数学符号和各种键盘符号数量之间的兑换关系可以有所不同。Token 是自然语言处理模型中的一个基本单位,它可以是一个字符、一个单词或一个子词。以下是一些常见的兑换关系: 英文字词(English Words) 通常,一个简单的英文单词(如“cat”、“dog”)对应一个 Token。 复杂的单词或不常见的单词可能会分成多个 Token。 中文简体字(Chinese Simplified Characters) 一个汉字通常对应一个 Token,例如,“你好”会被分成两个 Token。 但是,如果使用的是基于字词的模型,一个词语(如“北京”)也可能被视为一个 Token。 数学符号(Mathematical Symbols) 数学符号通常每个符号对应一个 Token。例如,“+”、“-”、“=”、“∫” 等。 各种键盘符号(Keyboard Symbols) 键盘符号(如标点符号、特殊字符)通常每个符号对应一个 Token。例如,“@”、“#”、“$”、“&” 等。 示例 假设你有以下文本: 英文:“Hello, world!” 中文:“你好,世界!” 数学:“x = y + z” 键盘符号:“@#$%^&*()” Token分解结果可能如下: 英文:“Hello, world!” -> [“Hello”, “,”, “world”, “!”] -> 4 Tokens 中文:“你好,世界!” -> [“你”, “好”, “,”, “世”, “界”, “!”] -> 6 Tokens 数学:“x = y + z” -> [“x”, “=”, “y”, “+”, “z”] -> 5 Tokens ...

2025-2-16 · 1 分钟 · Atom.X

IT管理和培训

面向人群:非IT专业,想独立创业,缺乏IT基础,需要改进个人信息资产管理水平。 欢迎加入我们,如果你属于以下情况: 数字资产管理 总是记不住密码和账户,多次发生账户丢失; 重复申请了很多(社交媒体、邮箱)账户; 担心电脑、手机被黑客入侵,或者糟糕情况已经发生; 如何选择购买手机、电脑、投影机等家用数字硬件设备; 不知道如何管理手机和电脑等数字硬件设备; 在电脑上安装软件出错或互相冲突; 无法控制上网时间,不停刷抖音短视频和网络文章; 不知道如何管理个人电脑中的文件和目录,不小心误删除或丢失,再也找不到; 被网络广告吸引,购买一些软件或生活用品,但是又后悔上当受骗; 不会识别网络诈骗和虚假广告,掉入赌博、虚拟货币等诈骗的陷阱; 网络营销 写个人简介,博客,软文; 想建个人网站,不知道怎么做选择; 使用云计算平台的各种丰富软件产品; 使用最前沿的AI辅助工作和生活; 培训方式 在线会议、阅读网页、文件,不能参加实时线上会议的人,可以听会议播客的音频节目; 以及通过discord群的问答辅导; 报名和收费 报名方式,请通过任何一种方式联系我们。 仅面向朋友圈,2025年限额招收20人,1千欧元/人/年,接收现金、银行转账、等各种网络付款方式。

2025-1-1 · 1 分钟 · Atom.X

与小伙伴们的邮件交流

小Yao做了自媒体账号,推出去的访问为0,为此请我转发,于是有了下面的交流话题。 Atom回信1 小Yao同学好, 出去之后我就更少用微信了,社交媒体使用率几乎为0,我帮人转自媒体,可能访问量也是0. 回复你的问题,我的判断是,需要做全局调研和策划,做一个整体发展方案,仅仅转自媒体的效果欠佳。 加入一个强力保障的组织吧,作为个体很难独立发展,因为现代教育把人都培养成某种专才,大多数人缺乏独立经营和社交能力的。建议进入体制内,与你的专业相关的组织包括:教育系统、传统文化书院、寺庙、大型商业公司等。 如果独立发展,网络上出海是最短捷径,可能外国人更接纳书法和中国传统文化,但你一个人要做很多事,学习很多其他技能,要么找几个合作伙伴,需要大量社交,这对于内向的孩子很难。 中国的数字游民社区总体是比较懒散的组织,对个人成长是不利的,很多管理者和住户缺乏进取心的,躺平摆烂是常态,和他们在一起怎么会有突破和提升? 要么,去义乌何斯路村探访一下,见退休的村书记何允辉叔叔,如果你能融入他的村庄和人脉圈,或许对你有助力。 我没有推荐其他人和地方,因为社会人的腐朽败坏,可能让你赚到钱,但失去人性的正直善良,得不偿失,我们都苦于找到智者和有温度的人同行。 共勉在路上的人,勇猛精进,开拓创新! 注释 小Yao是一名书法家,我们在某数字游民社区相遇,还有遇到很多其他各种专业的同学,该如何帮助每个人,或共谋发展呢?我想到的唯一办法,就是创建自己的一个强有力的社区组织,才能批量帮助到很多人,一个一个地来,我实在忙不开了。 难点是,现在大多数人都缺乏社交和管理能力,不想主动组织,而是被动等着别人来组织,关键是双方都要主动积极才能促成合作,不能单向帮助,要双向奔赴。 小Yao回信1 我讨厌体制内,就是想做一个个人工作室,我的家人也非常支持我做自己喜欢的事,富阳的工作室因为是自己的房子,没有房租压力了,运营压力会比之前在滨江租工作室要小一些,但由于是换了新地方,线下课又得从零开始招生积累,同样面临着挑战。 不过这些年我已经积累了很多招生运营的经验,知道自己接下去该怎么做,告诉你个好消息,我已经招到新工作室的第一个学生了[Joyful] Atom回信2 我所谓体制的概念比一般人说的更大,只要是一堆人的有规则的组织都是体制。这取决于你要做多大的事业,如果学员比较多,你可能要招多个辅助的工作人员,还要有社交和公关,与外部的某些大的机构组织有合作关系,包括政府的文教等事业部门,这些都是体制。 每个人都处在体制之中,不可能逃离体制。我能理解一些,为何现代人要充分独立,不与家庭、单位、甚至政府有任何关系。 这样的状况,通常弊大于利,世界上只有极少数人可以独立生存,譬如终南山隐居的修士,西伯利亚荒野猎人。 我的事业方式,一直都是与巨大单位有关系,意味着体制等级森严,我也厌恶体制的某些方面条件,但是我更多从体制里获取各种有利资源。体制于我是一个中性词,就好比是钱或工具,可以用来干好事,也有干坏事的。如果弊大于利,而我无法改变它,那就脱离体制,拎包跑路。 还有,抄写金刚经或一些古圣先贤的经典名言吧,出门作为礼物赠送,与人结缘,或者卖了,如果卖不出去,积攒多年后,也能增值,类似你现在就是一个潜力股,每一张作品就是一张股票,如果你对自己有信心,现在就开始这么做,多存一些,等着将来有人高价收购,一字千金哪。 无论如何,希望我们将来可以聚到一起,有共事合作机会,去义乌走访一下吧,拜访何叔叔,你或许有新发现,新的通途,找一些不同年龄层次的朋友和师傅,丰富阅历总是有好处的。不一个人奋斗,找一帮同频的伙伴吧。 新年我有一个课题,关于如何加入体制,更好运用体制的便利和资源,却不会完全被体制绑架。 祝福你有新的开始 !新年万事更新 ! 小Yao回信2 可能我们的理念有所不同,我不想做大,我只想做一个小而美的工作室 Atom回信3 希望你的工作,将来能在我的工作覆盖范围内,这样我们就有机会交集啦,我想做大的事业,因为有很多的责任,要保护和珍惜这世界上的好孩子。无论如何,祝福大家。

2024-12-29 · 1 分钟 · Atom.X

翻译项目需求概述

适用于多语言版本的博客或网页文档翻译 开发程序语言:python,给程序逐行写英文注释; API:Google Cloud Translation API,使用高级翻译模型; 备注:此前尝试调用 Google Translation API 的NMT基础模型,可能它不识别文档格式的语法标记,导致被翻译后的文件格式混乱。为了避免这种情况,需要使用更先进的翻译模型,能够理解和保留文档格式; 源语言:此为源文件内容的人类自然语言版本(语言标签),程序应能自动识别源语言类别,也可在程序中定义默认源语言; 语言标签: Translation API 的多语种翻译功能使用 BCP 47 语言标签作为输入和输出的语言标识符,主要组成部分是ISO 639 标准中的语言代码,和ISO 3166 标准中的地区代码,例如 zh-TW 台湾正体、zh-CN 中文简体。 目标语言:把源文件内容翻译成我们想要的其他人类自然语言版本,文件的目录名称定义了目标语言,例如目录名 en 英文,de 德文。目录名并不一定与语言标签完全一致,例如目录zhs中文简体(语言标签 zh-CN ),en英文(不区分en-US美国英语 和 en-GB英国英语); 源文件目录中可能有多级子目录、子文件等等,程序应该能识别并逐个检索并完成全部文件的翻译; 全部的目标语言目录及其文件结构与源语言目录保持一致,文件名也都是一样的,仅仅是目录名(en,de,zhs)不同。 本项目处理多语言版本的博客文件,在目标语言目录中持续有新的源语言文件,程序应跳过已经翻译成目标语言的文件,仅仅翻译新的源语言文件。例如en目录中大部分都是英文版本内容的文件,但是持续有源语言zh-TW的文件被添加进去,每次运行程序将其批量翻译成目标语言en。 程序会直接将翻译后的内容覆盖到目标语言目录中对应的源语言文件中,而不需要从源语言目录中复制文件到目标语言目录中。 文件格式 源文件格式:根据文件名后缀判断文件格式,如.md, .yaml, .xml等等。例如文件名以.md结尾,filename.md,属于markdown格式; 多格式并存:可能需要同时处理多种混合格式的文件,但是为了提高效率,我们尽可能每次只处理同一种格式文件; 自动检测文件格式:确保翻译模型能理解不同格式的语法标记,根据格式类型选择相应的处理方案,能保留源文件格式,这是最重要的翻译模型能力; 特别注意事项 文件格式的语法标记是不可翻译的,例如md文件中带有markdown格式标记,必须保留翻译后的文件与源文件相同的格式; 引用圣经、名言、人名、地名、图书、电影名称、汉语成语和寓言等应该保留一份原文的源语言,同时一份对应翻译的目标语言; 文件目录名、文件名不要翻译,因为作为最终网页url的一部分,应始终保持其英文语言版本; 问题 本项目所选用的翻译模型能有效识别并保留源文件的格式(例如markdown,YAML等待)吗? 若翻译模型能识别大部分的文件格式标记,那么我们就没必要采用复杂的文件格式解析库,因为我们翻译后的文件依然保留原文件的格式标记,所以仅仅是翻译了有必要翻译的文本内容。 翻译模型能识别出哪些文本是待翻译的内容?哪些部分引用的文本应该保持原文不翻译呢?例如我们把英文圣经和经典句子翻译成中文,那么应该保留一份原文,同时翻译一份中文对照。 c++也能做本项目开发,但相比较python而言,更复杂; 调用 Translation API 并选用高级模型,是否需要先设置endpoint,并在Google Cloud控制台中进行特殊配置?如何简单高效地调用API,提供配置和调用的最佳实践。

2024-12-11 · 1 分钟 · Atom.X