
阿升
V1
2023/03/01阅读:40主题:默认主题
FlexGen:只需要一块RTX 3090跑ChatGPT 1750亿参数体量模型
计算成本是人们打造ChatGPT等大模型面临的重大挑战之一,最近一种名为FlexGen的技术因为一块RTX3090跑ChatGPT体量模型而获得关注。






参考文献:
[1]FlexGen:https://github.com/FMInference/FlexGen
作者介绍

阿升
V1
吾爱DotNet(公众号)
阿升
2023/03/01阅读:40主题:默认主题
计算成本是人们打造ChatGPT等大模型面临的重大挑战之一,最近一种名为FlexGen的技术因为一块RTX3090跑ChatGPT体量模型而获得关注。
参考文献:
[1]FlexGen:https://github.com/FMInference/FlexGen
作者介绍
吾爱DotNet(公众号)