ENLSP NeurIPS Workshop 2023 | ENLSP highlights some fundamental problems in NLP and speech processing related to efficiency of the models, training and inference for the general ML and DL communities.

Accepted papers

poster

What is Lost in Knowledge Distillation?

Paper

poster

NLLB-CLIP - train performant multilingual image retrieval model on a budget

Paper Appendix

poster

DePT: Decomposed Prompt Tuning for Parameter-Efficient Fine-tuning

Paper

poster

LLM-MQ: Mixed-precision Quantization for Efficient LLM Deployment

Paper Appendix

poster

DYAD: A Descriptive Yet Abjuring Density Efficient Approximation to Linear Neural Network Layers

Paper

poster

Transfer Learning for Structured Pruning under Limited Task Data

Paper

poster

Embedding User-Generated Content using Structural Supervision and Generative Models

Paper

poster

Parameter Efficient Finetuning for Reducing Activation Density in Transformers

Paper

poster

GQKVA: Efficient Pre-training of Transformers by Grouping Queries, Keys, and Values

Paper

poster

Query-Dependent Prompt Evaluation and Optimization with Offline Inverse RL

Paper

poster

Structure Discovery in Prompted Weak Supervision

Paper

poster

SPEED: Speculative Pipelined Execution for Efficient Decoding

Paper

poster

Efficiently Adapting Pretrained Language Models to New Languages

Paper

poster

MultiPrompter: Cooperative Prompt Optimization with Multi-Agent Reinforcement Learning

Paper

poster

Efficient LLM Inference on CPUs

Paper

poster

FlashFFTConv: Efficient Convolutions for Long Sequences with Tensor Cores

Paper

poster

Efficient Long-Range Transformers: You Need to Attend More, but Not Necessarily at Every Layer

Paper

poster

IceFormer: Accelerated Inference with Long-Sequence Transformers on CPUs

Paper

poster

On the Zero-Shot Generalization of Machine-Generated Text Detectors

Paper

poster

Intra-Class Similarity-Guided Feature Distillation

Paper

poster

Less is More! A slim architecture, optimal for language tasks

Paper

poster

Comprehensive Bench-marking of Entropy and Margin Based Scoring Metrics for Data Selection

Paper

poster

Lightweight Retrieval Tuning for Black-Box Language Models

Paper

poster

Skeleton-of-Thought: Large Language Models Can Do Parallel Decoding

Paper

poster

Investigating the Impact of Compression on Parametric Knowledge in Language Models

Paper

poster

Get more for less: Principled Data Selection for Warming Up Fine-Tuning in LLMs

Paper

poster

Exploiting Transformer Activation Sparsity with Dynamic Inference

Paper

poster

Retrieval Augmented Generation for Dialog Modeling

Paper

poster

Decoding Data Quality via Synthetic Corruptions: Embedding-guided Pruning of Code Data

Paper

poster

TCNCA: Temporal Convolution Network with Chunked Attention for Scalable Sequence Processing

Paper Appendix

poster

Ensemble of low-rank adapters for large language model fine-tuning

Paper

poster

Sorted LLaMA: Unlocking the Potential of Intermediate Layers of Large Language Models for Dynamic Inference Using Sorted Fine-Tuning (SoFT)

Paper

poster

Sheared LLaMA: Accelerating Language Model Pre-training via Structured Pruning

Paper

poster

BTLM-3B-8K: 7B Parameter Performance in a 3B Parameter Model

Paper

poster

Sparse Fine-Tuning for Inference Acceleration of Large Language Models

Paper

poster

Model Tells You What to Discard: Adaptive KV Cache Compression for LLMs

Paper

poster

LoDA: Low-Dimensional Adaptation of Large Language Models

Paper

poster

MUX-PLMs: Data Multiplexing for High-throughput Language Models

Paper

poster

Towards End-to-end 4-Bit Inference on Generative Large Language Models

Paper

poster

SortedNet, a Place for Every Network and Every Network in its Place

Paper

poster

FineQuant: Unlocking Efficiency with Fine-Grained Weight-Only Quantization for LLMs

Paper

poster

KronA: Parameter Efficient Tuning with Kronecker Adapter

Paper

poster

ReLU Strikes Back: Exploiting Activation Sparsity in Large Language Models

Paper Appendix

poster

SwiftLearn: A Data-Efficient Training Method of Deep Learning Models using Importance Sampling

Paper

poster

MatFormer: Nested Transformer for Elastic Inference

Paper

poster

LoftQ: LoRA-Fine-Tuning-Aware Quantization for Large Language Models

Paper

poster

Herd: Using multiple, smaller LLMs to match the performances of proprietary, large LLMs via an intelligent composer

Paper

poster

Efficient Online Data Mixing For Language Model Pre-Training

Paper

poster

Student as an Inherent Denoiser of Noisy Teacher

Paper

poster

UT5: Pretraining Non autoregressive T5 with unrolled denoising

Paper

poster

LatticeGen: A Cooperative Framework Which Hides Generated Text in A Lattice For Privacy-Aware Generation on Cloud

Paper

poster

Measuring and Improving Recall in Convolutional Language Models

Paper

poster

Multimodal Multi-Hop Question Answering Through a Conversation Between Tools and Efficiently Finetuned Large Language Models

Paper

poster

Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws

Paper

poster

Continual Pre-Training of Large Language Models: How to (re)warm your model?

Paper

poster

Improving Natural Language Understanding with Computation-Efficient Retrieval Representation Fusion

Paper

poster

Improving Linear Attention via Softmax Mimicry

Paper

poster

Mixture of Quantized Experts (MoQE): Complementary Effect of Low-bit Quantization and Robustness

Paper

poster

DiffTune: A Diffusion-Based Approach to Diverse Instruction-Tuning Data Generation

Paper

poster

PaSS: Parallel Speculative Sampling

Paper

poster

QDyLoRA: Quantized Dynamic Low-Rank Adaptation for Efficient Large Language Model Tuning

Paper

poster

Model Fusion through Bayesian Optimization in Language Model Fine-Tuning

Paper

poster

Group Preference Optimization: Few-Shot Alignment of Large Language Models

Paper

poster

Fast-ELECTRA for Efficient Pre-training

Paper

poster

Parameter-Efficient Fine-tuning of InstructBLIP for Visual Reasoning Tasks

Paper

poster

Local LoRA: Memory-Efficient Fine-Tuning of Large Language Models

Paper

poster

A Leap Forward in LLMs Post-Training W4A8 Quantization Using Floating-Point Formats

Paper

poster

Exploring Post-training Quantization in LLMs from Comprehensive Study to Low Rank Compensation

Paper

poster

DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing

Paper

poster

Arabic Mini-ClimateGPT : A Climate Change and Sustainability Tailored Arabic LLM

Paper

poster

Multimodal Data and Resource Efficient Device-directed Speech Detection with Large Foundation Models

Paper

poster

Representative Subset Selection for Efficient Fine-Tuning in Self-Supervised Speech Recognition

Paper

poster

ASR Data Selection from Multiple Sources: A Practical Approach on Performance Scaling

Paper

poster

Fed-EE: Federating Heterogeneous ASR Models using Early-Exit Architectures

Paper

poster

Recursive Joint Cross-Attention for Audio-Visual Speaker Verification

Paper

poster

Efficient infusion of self-supervised representations in Automatic Speech Recognition

Paper

poster

An efficient clustering algorithm for self-supervised speaker recognition

Paper

poster

HateXplain Space Model: Fusing Robustness with Explainability in Hate Speech Analysis

Paper

poster

Revealing the Bias in Large Language Models via Reward Based Questioning

Paper

poster

Evaluating task specific finetuning for protein language models

Paper Appendix