How to design self-attention for a safer Transformer AI?

Despite advancements in Deep Learning, adversarial attacks remain problematic, including NLP and transformer models. This project assesses various self-attention mechanisms to enhance transformer robustness against adversarial attacks in NLP.

Full PDF link: https://github.com/Falanke21/Neural-Network-Architectures-for-Adversarially-Robust-NLP/blob/master/Neural%20Network%20Architectures%20for%20Adversarially%20Robust%20NLP.pdf

RNN & LSTM vs. Transformer:

Comparing sequential models like RNN and LSTM with the parallel processing of transformers.

Adversarial Attacks:

Explanation of NLP-focused adversarial attacks and their impact.

Experimental Setup:

We are utilizing Yelp-polarity sentiment analysis and TextAttack for robustness evaluation.

Self-Attention Variants:

Brief overview of Additive Attention, Paas, Linformer, SimA, SOFT, CosFormer, and TransNormer.

Ablation Studies:

Exploration of Diag attention and its impact on model robustness.

Word Embeddings:

Comparison of custom, GloVe, and Counter-fitting word embeddings.

Number of Heads:

Examining the influence of head number on transformer model robustness.

ReVA & ReVCos:

Introduction of ReLU Value attention and ReLU Value CosFormer for enhanced robustness.

Adversarial Training:

Results of adversarial training using Textfooler method.

Scaling Capacity:

Discussion on the scalability of attention mechanisms in larger transformer models.

Name		Name	Last commit message	Last commit date
Latest commit History 154 Commits
config		config
data		data
images		images
lstm		lstm
training_scheme		training_scheme
transformer		transformer
utils		utils
.gitignore		.gitignore
Neural Network Architectures for Adversarially Robust NLP.pdf		Neural Network Architectures for Adversarially Robust NLP.pdf
README.md		README.md
example-attack-lstm.sh		example-attack-lstm.sh
example-attack.sh		example-attack.sh
example-main-adv.sh		example-main-adv.sh
example-main.sh		example-main.sh
example-train-adv.sh		example-train-adv.sh
example-train-lstm.sh		example-train-lstm.sh
example-train-resume.sh		example-train-resume.sh
example-train.sh		example-train.sh
main.py		main.py
requirements.txt		requirements.txt
ta_data_loader.py		ta_data_loader.py
ta_data_loader_validation.py		ta_data_loader_validation.py
ta_model_loader.py		ta_model_loader.py
test.py		test.py
train.py		train.py
validation.py		validation.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

How to design self-attention for a safer Transformer AI?

Despite advancements in Deep Learning, adversarial attacks remain problematic, including NLP and transformer models. This project assesses various self-attention mechanisms to enhance transformer robustness against adversarial attacks in NLP.

RNN & LSTM vs. Transformer:

Adversarial Attacks:

Experimental Setup:

Self-Attention Variants:

Ablation Studies:

Word Embeddings:

Number of Heads:

ReVA & ReVCos:

Adversarial Training:

Scaling Capacity:

About

Releases

Packages

Languages

Falanke21/Neural-Network-Architectures-for-Adversarially-Robust-NLP

Folders and files

Latest commit

History

Repository files navigation

How to design self-attention for a safer Transformer AI?

Despite advancements in Deep Learning, adversarial attacks remain problematic, including NLP and transformer models. This project assesses various self-attention mechanisms to enhance transformer robustness against adversarial attacks in NLP.

RNN & LSTM vs. Transformer:

Adversarial Attacks:

Experimental Setup:

Self-Attention Variants:

Ablation Studies:

Word Embeddings:

Number of Heads:

ReVA & ReVCos:

Adversarial Training:

Scaling Capacity:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages