mindie开启DeepSeek的128K

news/2025/10/11 16:44:19/文章来源:https://www.cnblogs.com/mar/p/19135403

  需要修改的地方有2处:

一、启动脚本:

source /usr/local/Ascend/ascend-toolkit/set_env.sh
source /usr/local/Ascend/nnal/atb/set_env.sh
source /usr/local/Ascend/atb-models/set_env.sh
source /usr/local/Ascend/mindie/set_env.sh
export RANK_TABLE_FILE="/app1/scripts/ranktable.json"
export MIES_CONTAINER_IP="192.168.1.234"
export MASTER_IP="192.168.1.234"
export WORLD_SIZE=16export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True
export HCCL_OP_EXPANSION_MODE="AIV"
export NPU_MEMORY_FRACTION=0.96
export ATB_LLM_HCCL_ENABLE=1
#export INF_NAN_MODE_ENABLE=1
export OMP_NUM_THREADS=10
#export TASK_QUEUE_ENABLE=2

export MINDIE_ASYNC_SCHEDULING_ENABLE=1
export ATB_OPERATION_EXECUTE_ASYNC=1
export ATB_LLM_ENABLE_AUTO_TRANSPOSE=0
export HCCL_BUFFSIZE=64
export ATB_WORKSPACE_MEM_ALLOC_ALG_TYPE=3
export ATB_WORKSPACE_MEM_ALLOC_GLOBAL=1
export ATB_LAYER_INTERNAL_TENSOR_REUSE=1
export LD_PRELOAD="/usr/lib64/libjemalloc.so.2:$LD_PRELOAD"export HCCL_ALGO="level0:NA;level1:pipeline"
for var in $(compgen -e | grep 'STDOUT$'); do export "$var=0"; done
for var in $(compgen -e | grep 'LOG_TO_FILE$'); do export "$var=0";doneexport HCCL_CONNECT_TIMEOUT=3600
export HCCL_EXEC_TIMEOUT=0
export MINDIE_LOG_LEVEL=info
export MINDIE_LOG_TO_STDOUT=1cd /usr/local/Ascend/mindie/latest/mindie-service/
./bin/mindieservice_daemon

 

二、配置文件(mindie的/usr/local/Ascend/mindie/latest/mindie-service/conf/config.json):

{"Version" : "1.0.0","ServerConfig" :{"ipAddress" : "192.168.1.234","managementIpAddress" : "192.168.1.234","port" : 1025,"managementPort" : 1026,"metricsPort" : 1027,"allowAllZeroIpListening" : false,"maxLinkNum" : 1000,"httpsEnabled" : false,"fullTextEnabled" : false,"tlsCaPath" : "security/ca/","tlsCaFile" : ["ca.pem"],"tlsCert" : "security/certs/server.pem","tlsPk" : "security/keys/server.key.pem","tlsPkPwd" : "security/pass/key_pwd.txt","tlsCrlPath" : "security/certs/","tlsCrlFiles" : ["server_crl.pem"],"managementTlsCaFile" : ["management_ca.pem"],"managementTlsCert" : "security/certs/management/server.pem","managementTlsPk" : "security/keys/management/server.key.pem","managementTlsPkPwd" : "security/pass/management/key_pwd.txt","managementTlsCrlPath" : "security/management/certs/","managementTlsCrlFiles" : ["server_crl.pem"],"kmcKsfMaster" : "tools/pmt/master/ksfa","kmcKsfStandby" : "tools/pmt/standby/ksfb","inferMode" : "standard","interCommTLSEnabled" : false,"interCommPort" : 1121,"interCommTlsCaPath" : "security/grpc/ca/","interCommTlsCaFiles" : ["ca.pem"],"interCommTlsCert" : "security/grpc/certs/server.pem","interCommPk" : "security/grpc/keys/server.key.pem","interCommPkPwd" : "security/grpc/pass/key_pwd.txt","interCommTlsCrlPath" : "security/grpc/certs/","interCommTlsCrlFiles" : ["server_crl.pem"],"openAiSupport" : "vllm","tokenTimeout" :3600,"e2eTimeout" : 3600,"distDPServerEnabled":false},"BackendConfig" : {"backendName" : "mindieservice_llm_engine","modelInstanceNumber" : 1,"npuDeviceIds" : [[0,1,2,3,4,5,6,7]],"tokenizerProcessNumber" : 8,"multiNodesInferEnabled" : true,"multiNodesInferPort" : 1120,"interNodeTLSEnabled" : false,"interNodeTlsCaPath" : "security/grpc/ca/","interNodeTlsCaFiles" : ["ca.pem"],"interNodeTlsCert" : "security/grpc/certs/server.pem","interNodeTlsPk" : "security/grpc/keys/server.key.pem","interNodeTlsPkPwd" : "security/grpc/pass/mindie_server_key_pwd.txt","interNodeTlsCrlPath" : "security/grpc/certs/","interNodeTlsCrlFiles" : ["server_crl.pem"],"interNodeKmcKsfMaster" : "tools/pmt/master/ksfa","interNodeKmcKsfStandby" : "tools/pmt/standby/ksfb","ModelDeployConfig" :{"maxSeqLen" : 131072,"maxInputTokenLen" : 131072,"truncation" : false,"ModelConfig" : [{"modelInstanceType" : "Standard","modelName" : "DeepSeek-R1","modelWeightPath" : "/app1/models/DeepSeek-R1-0528-w8a8","worldSize" : 8,"cpuMemSize" : 5,"npuMemSize" : -1,"backendType" : "atb","trustRemoteCode" : false,"moe_ep": 16,"moe_tp": 1,"sp": 8,"cp": 2,"tp": 8,"dp": 1,"ignore_eos": true,"async_scheduler_wait_time": 120,"kv_trans_timeout": 10,"kv_link_timeout": 1080,"models":{"deepseekv2": {"ep_level":1,"enable_init_routing_cutoff": true,"topk_scaling_factor": 0.25}}                }]},"ScheduleConfig" :{"templateType" : "Standard","templateName" : "Standard_LLM","cacheBlockSize" : 128,"maxPrefillBatchSize" : 50,"maxPrefillTokens" : 131072,"prefillTimeMsPerReq" : 150,"prefillPolicyType" : 0,"decodeTimeMsPerReq" : 50,"decodePolicyType" : 0,"maxBatchSize" : 200,"maxIterTimes" : 131072,"maxPreemptCount" : 0,"supportSelectBatch" : false,"maxQueueDelayMicroseconds" : 5000}}
}

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/934898.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MATLAB的无刷直流电机转速电流双闭环仿真实现

一、系统架构与建模原理 1. 双闭环控制结构 无刷直流电机(BLDC)双闭环控制系统由转速外环和电流内环构成:转速环:通过PI控制器调节参考电流幅值,实现转速稳定。 电流环:采用滞环控制或SVPWM调制,确保相电流快速…

AI设计软件/工具/品牌/方案/大模型/开源模型/平台/小程序/插件公司推荐:专注多场景智能设计解决方案供应!

随着数字经济、文创产业、企业数字化转型及个人创意需求的快速发展,AI 设计作为提升创作效率、降低设计门槛、保障视觉统一性的核心工具,市场需求持续攀升。但行业乱象凸显:部分厂家以 “AI 设计” 为噱头,实际功能…

STM32环境配备keil5【保姆级】

STM32环境配备keil5【保姆级】pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco"…

软考中项备考经验分享 - 详解

软考中项备考经验分享 - 详解2025-10-11 16:37 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important…

微波雷达模块让广告灯告别无效展示

在商场步行街的夜晚,投影灯把品牌Logo投射在地面,光影流转间诉说着商家的期待。但问题是——当广告常亮,谁还会多看一眼?当电表持续转动,谁来为这份"无效曝光"买单?智能照明行业正在经历一场从"工具…

2025七水硫酸锌供货厂家最新推荐榜:品质稳定与高效服务的优

2025七水硫酸锌供货厂家最新推荐榜:品质稳定与高效服务的优随着工业和农业领域对七水硫酸锌需求的不断增加,选择一个可靠的供应商变得尤为重要。本文将为您推荐几家在业内享有良好口碑的七水硫酸锌供货厂家,并提供详…

从 1 到 1000:MyEMS 社区如何用开源力量搭建中小企业的 “零碳工具箱”?

在 “双碳” 目标推进中,中小企业的零碳转型始终面临 “想转却转不动” 的困境:商业能源管理系统动辄数十万的采购成本、专业技术团队的缺失、碎片化的节能需求难以被满足。而 MyEMS(My Energy Management System)…

为什么你的项目总是延期?90%的团队忽略了这5个预警信号

你有没有遇到过这样的情况:项目刚启动的时候,大家干劲十足,老板也信誓旦旦地说,“三个月必须上线!” 结果一个月过去了,需求还在改; 两个月过去了,开发还在加班补Bug; 到了交付节点,测试才发现一堆问题没解决…

变量、常量和作用域

变量 局部变量 局部变量定义在方法内部,必须初始化; 局部变量初始化和输出输出结果为10 类变量 存在于类内部,和类一起存在/消失;定义时需要加修饰符static,否则会出错,可以不做初始化,不初始化情况同实例变量;…

用python定义类时,用子类继承父类,当父类需要从子类中传递很多形参时,该怎么处理

当父类需要从子类传递很多参数时,直接在子类中逐个传递参数会导致代码冗长、易出错且难以维护。此时可以通过 *args 和 **kwargs 简化参数传递,或结合 “参数分组”“显式声明必要参数” 等技巧,平衡灵活性和可读性…

LLM Agentic Memory Systems

LLM Agentic Memory Systems https://kickitlikeshika.github.io/2025/03/22/agentic-memory.html#1-working-memoryIntroduction Current AI systems, particularly those built around Large Language Models (LLMs)…

量化(一)

在神经网络量化过程中,指数平滑法、直方图截断法和KL散度校准法都是用于优化量化过程中缩放因子的计算和选择的技术。这些方法通常旨在尽量减小量化误差,保持模型性能。下面分别解释这三种方法: 1. 指数平滑法(Exp…

2025 年试验箱厂商最新推荐排行榜:涵盖高低温 / 恒温恒湿 / 冷热冲击等设备,精选研发实力强、质量管控严的优质企业

随着工业制造、航空航天、电子通讯等领域飞速发展,试验箱作为检测产品性能稳定性的关键设备,需求日益增长。但当前市场上试验箱制造企业数量繁杂,部分企业存在技术创新不足、设备精度不达标、售后服务滞后等问题,导…

2025 最新化粪池生产厂家推荐排行榜:聚焦老牌标杆与新锐力量,预制 / 玻璃钢品类权威甄选钢筋混凝土/一体/成品/拼装式化粪池厂家推荐

随着城镇化推进与环保政策收紧,化粪池作为市政与民用建筑核心配套,市场需求持续攀升,但行业乱象却愈发凸显:部分厂家工艺粗糙导致产品渗漏率超 30%,使用寿命不足 10 年;多数中小品牌仅能提供单一材质产品,难以适…

MyEMS + 边缘网关:偏远基站如何实现 “无人值守” 下的精准能耗管理?

在通信网络覆盖不断向偏远地区延伸的过程中,偏远基站的运维难题逐渐凸显。这类基站多位于山区、荒漠等地理环境恶劣区域,交通不便、人工运维成本高,且传统 “定期巡检 + 人工调控” 的能耗管理模式,常因数据滞后、…

2025 云栖精选资料:《从云原生到 AI 原生核心技术与最佳实践》PPT 免费下载

AI 原生不再是一个新的概念,而是企业在业务落地实践过程中已经形成的共识。不论是技术团队还是业务部门,都认同 AI 原生已经成为了应用架构的新范式。AI 原生不再是一个新的概念,而是企业在业务落地实践过程中已经形…

Salesforce项目老掉坑?这8个思维陷阱千万别踩

在做Salesforce项目时,你可能遇到过这样的情况: 估算的工作量一拖再拖,本以为的小功能上线后没人用,快速上线却带来长期隐患,客户对新系统抵触甚至不信任……这些问题表面上和需求、技术、流程有关,其实背后往往…

加权图异常检测技术获最具影响力论文奖

卡内基梅隆大学教授Christos Faloutsos因提出加权图异常检测新方法荣获PAKDD最具影响力论文奖,该技术可应用于社交网络欺诈检测、电信网络异常发现等多个领域。Christos Faloutsos荣获PAKDD"最具影响力论文奖&qu…

java基础3-判断和循环

1.顺序结构:顺序结构语句是java程序默认的执行流程,按照代码的先后顺序,从上到下依次执行 2.分支结构:if语句:结构1 if (关系表达式){语句体;  }public class Java01 {public static void main(String[] args…

基于模拟退火的粒子群优化算法的解析

基于模拟退火的粒子群优化算法(Simulated Annealing Particle Swarm Optimization, SAPSO)的解析一、算法原理与创新点 1. 核心思想融合粒子群优化(PSO):通过群体协作搜索最优解,但易陷入局部最优。 模拟退火(S…