直接越过2bit这一量化级别,对LLM大语言模型进行1bit量化尝试!
                                
                            
                            
                                
                                    2024-03-12
                                
                                
                            
                        
                                
                                QT的桌游鉴赏集
                            
                                
                                大文件断点续传问题解决方案
                            
                                
                                this的绑定规则详解
                            
                                
                                前端知识点大纲汇总
                            
                                
                                适用于大规模Transformers的8bit矩阵乘法——LLM.int8()
                            
                                
                                LSQ的Pytorch代码实现