24.09版本网址
仓库 |
Gitee |
GitHub |
DeepSpark |
||
DeepSparkHub |
||
DeepSparkInference |
DeepSparkHub
模型与算法
● 新增了5个PyTorch训练模型,其中3个为Stable Diffusion模型。
● 新增了4个大语言模型相关训练示例。
○ ChatGLM3-6B (DeepSpeed)
○ Llama3-8B (Megatron-DeepSpeed)
○ Qwen1.5-7B (Firefly)
○ Qwen1.5-14B (Firefly)
问题修复
● 修复了HardNet PyTorch模型的torchvision导入报错的问题。
● 同步了AlexNet,EfficientNet_B4等PyTorch模型的代码。
● 同步了AlexNet,FaceNet,InceptionV3,VGG16等TensorFlow模型的代码。
● 同步了工具箱Megatron-Deepspeed大语言模型框架的代码。
感谢以下社区贡献者
李一力,sanghui-ilu,majorli,Jino Yang,吴永乐。
DeepSparkInference
模型与算法
● 新增了29个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的14个。
● 添加了对ByteMLPerf工具箱的支持。
● 新增了5个大语言模型的推理示例。
○ Llama3-70B (TensorRT-LLM)
○ Qwen1.5-7B (Text Generation Inference)
○ Qwen1.5-7B (vLLM)
○ Qwen1.5-14B (vLLM)
○ Qwen1.5-72B (vLLM)
问题修复
● 修复了BERT Base SQUAD模型在NV环境上int8精度异常的问题。
● 修复了Mask RCNN模型在NV 24.04环境上运行编译报错的问题。
● 修复了CLIP IGIE模型对transformers版本有依赖的问题。
● 完善了IxRT部分模型的end2end推理时间打印。