Nyheter Revolutionerande AI-effektivitet: UC Berkeleys SqueezeLLM debuterar tät-och-gles kvantisering, förenar kvalitet och hastighet i stora språkmodeller