5030.大模型-数据集-文档分割 发表于 2025-02-18 | 分类于 LLM 一、文档分割方法基于规则的切分方法 字符/固定大小分块:按固定字符数或令牌数切分,简单但可能破坏语义连贯性。例如,指定每块300个字符,并设置重叠(如100字符)以减少信息割裂。 内容感知分块:利用标点符号、段落或标题等结构特征分割。例如,使用NLTK或spaCy进行句子或段落分割。 递归分块:多级 ... 阅读全文 »
3.5显示屏驱动安装 发表于 2025-02-17 | 分类于 编程拾慧 , raspberrypi 一、硬件连接准备好树莓派和3.5寸触摸屏,我这里使用的是3B,其他的型号应该也能兼容。 3.5寸屏幕 二、驱动安装直接上电后,屏幕是无法把内容显示出来的,默认是白屏,需要按照相关的驱动驱动下载github链接`shellgit clone https://github.com/goodtft/LCD ... 阅读全文 »
DataBase-文献数据库-PubMed_PMC 发表于 2025-02-12 | 分类于 知识沉淀 , 数据库 PMC(PubMed Central)和 PubMed 都是由美国国家生物技术信息中心(NCBI)维护的生物医学领域重要学术资源,但两者功能有所不同。往往也是我们研究过程中跳不过去的几个调研渠道。PubMed是一个免费的文献检索平台,主要收录生物医学领域的论文摘要与引文信息,覆盖包括MEDLINE在 ... 阅读全文 »
Software-CNV检测-ExonDepth 发表于 2025-01-07 | 分类于 NGS , software , 编程拾慧 , R , Linux ExonDepth githubExonDepth 帮助文档 ExomeDepth 是一个 R 软件包,旨在使用高通量 DNA 序列数据检测遗传拷贝数变异 (CNV)。虽然外显子组包含在包的名称中,但实际上它在较小的面板上表现最佳,因为包的分析利用了(通常)并行运行的大量样本之间的紧密相关结构。这些 ... 阅读全文 »
大模型- AI IDE 发表于 2025-01-06 | 分类于 LLM 截至目前,辅助编码的大模型已经层出不穷 微软旗下的GitHub与OpenAI合作推出的 GitHub Copilot 阿里云的AI编码助手通义灵码 百度推出的基于文心大模型智能编码助手 Comate 亚马逊云科技出品的 CodeWhispere Mistral AI今年7月发布其专为全球开发人员的 ... 阅读全文 »