文档转换-MarkItDown

发表于 2025-01-16 | 分类于 Tobeinsert

Web官方页面

大模型- AI IDE

发表于 2025-01-06 | 分类于 LLM

截至目前，辅助编码的大模型已经层出不穷微软旗下的GitHub与OpenAI合作推出的 GitHub Copilot 阿里云的AI编码助手通义灵码百度推出的基于文心大模型智能编码助手 Comate 亚马逊云科技出品的 CodeWhispere Mistral AI今年7月发布其专为全球开发人员的 ...

阅读全文 »

Nucleotide_Transformer-building_and_evaluating_robust_foundation_models_for_human_genomics

发表于 2024-12-27 | 分类于 Tobeinsert

Nucleotide Transformer 是一个 DNA 序列预训练基础模型，参数范围从 5000 万到 25 亿个参数，并集成了来自 3,202 个人类基因组的信息和850各其他物种的基因组信息。期实例包括在蛋白质序列上训练语言模型，他们的任务是预测大型蛋白质序列数据集中的隐藏氨基酸。当使用迁 ...

阅读全文 »

Sequence modeling and design from molecular to genome scale with Evo

发表于 2024-12-26 | 分类于 LLM ，算法

DNA是遗传物质，其重要性不言而喻，针对DNA、RNA和蛋白的研究也层出不穷。之前有很多基于Transformer的DNA模型，受限于起本身上下文长度的限制，经常采用寡居核苷酸而不是单碱基所谓模型训练/学习的基本单位。而本问开发的Evo模型，是一个包含7-billion-参数的模型，训练 ...

阅读全文 »

5003.大模型-架构-transformer-3.tokenizer

发表于 2024-12-24 | 分类于 LLM

由于神经网络模型不能直接处理文本，因此我们需要先将文本转换为数字，这个过程被称为编码 (Encoding)，其包含两个步骤：使用分词器 (tokenizer) 将文本按词、子词、字符切分为 tokens；将所有的 token 映射到对应的 token ID。分词策略根据切分粒度的不同，分词 ...

阅读全文 »

5003.大模型-架构-transformer-2.modle

发表于 2024-12-24 | 分类于 LLM

除了像之前使用 AutoModel 根据 checkpoint 自动加载模型以外，我们也可以直接使用模型对应的 Model 类，例如 BERT 对应的就是 BertModel： 12from transformers import BertModelmodel = BertModel.from_pr ...

阅读全文 »

0009.概念-术语-embeddings嵌入

发表于 2024-12-24 | 分类于 machine_learning

嵌入是值或文本、图像和音频等对象的表示，旨在供机器学习模型和语义搜索算法使用。它们根据每个物体可能有或可能没有的因素或特征，以及它们所属的类别，将这些物体转化为数学形式。从本质上讲，嵌入能让机器学习模型找到相似的对象。给定一张照片或一份文档，使用嵌入的机器学习模型就能找到类似的照片或文档。由于嵌入可 ...

阅读全文 »

大模型-编程基础-transformers-运行微调模型

发表于 2024-12-23 | 分类于 LLM

加载模块前，请记得升级 transformers的版本到最新版 pip install -U transformers，开始没升级，用的 4.27 各种报错，尤其是刚接触一度怀疑本地包的参数有问题浪费了不少时间，其实发现升级到新版就都可以正常使用了。另外由于每个模型在训练的时候，会有固定对应的分词器 ...

阅读全文 »

5003.大模型-基础架构-transformer

发表于 2024-12-23 | 分类于 LLM

Transformer是一种用于自然语言处理（NLP）和其他序列到序列（sequence-to-sequence）任务的深度学习模型架构，它在2017年由Vaswani等人在首次提出。Transformer架构引入了自注意力机制（self-attention mechanism），这是一个关键的创新 ...

阅读全文 »

5003.大模型-基础架构-hyena鬣狗

发表于 2024-12-23 | 分类于 LLM

https://ermongroup.github.io/blog/hyena/https://arxiv.org/pdf/2302.10866https://colab.research.google.com/github/expz/annotated-hyena/blob/master/anno ...

阅读全文 »