Layers that are never used in ByteLatentTransformer class #28

isayoften · 2025-01-19T15:20:38Z

Hello! Please check this line :

Line 834 in 6ffeb66

self.layers = nn.ModuleList(

It seems that these layers are here by mistake. All transformerblocks are defined inside the local and global parts. There is no self.layers in the forward at all also

isayoften · 2025-01-20T08:19:50Z

The same question about:

blt/bytelatent/model/blt.py

Line 831 in 6ffeb66

self.tok_embeddings = torch.nn.Embedding(args.vocab_size, args.dim)

and:

blt/bytelatent/model/blt.py

Line 854 in 6ffeb66

self.output = nn.Linear(args.dim, args.vocab_size, bias=False)

because we already have tok_embeds and unembeds in encoder and decoder:

blt/bytelatent/model/local_models.py

Line 81 in 6ffeb66

self.tok_embeddings = nn.Embedding(self.vocab_size, args.dim)

blt/bytelatent/model/local_models.py

Line 330 in 6ffeb66

self.output = nn.Linear(

isayoften · 2025-01-20T08:21:23Z

Also, we initialise tok_embeds twice because of super() call in the decoder:

blt/bytelatent/model/local_models.py

Line 308 in 6ffeb66

super().__init__(args)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Layers that are never used in ByteLatentTransformer class #28

Layers that are never used in ByteLatentTransformer class #28

isayoften commented Jan 19, 2025

isayoften commented Jan 20, 2025

isayoften commented Jan 20, 2025

Layers that are never used in ByteLatentTransformer class #28

Layers that are never used in ByteLatentTransformer class #28

Comments

isayoften commented Jan 19, 2025

isayoften commented Jan 20, 2025

isayoften commented Jan 20, 2025