xrsrke · xrsrke · Nov 28, 2023 · Nov 28, 2023
diff --git a/tests/nn/pipeline_parallel/test_partitioner.py b/tests/nn/pipeline_parallel/test_partitioner.py
@@ -1,24 +1,21 @@
 import pytest
 import torch
 from transformers import (
-    AutoModelForCausalLM,
     AutoTokenizer,
     BloomConfig,
     BloomForCausalLM,
+    GPT2Config,
+    GPT2LMHeadModel,
 )
 
 from pipegoose.nn.pipeline_parallel.partitioner import UniformPartitioner
 from pipegoose.testing.utils import init_parallel_context, spawn
 
 
 def get_gpt2_and_tokenizer():
-    return AutoModelForCausalLM.from_pretrained("gpt2"), AutoTokenizer.from_pretrained("gpt2")
-
-
-def get_bloom_560m_and_tokenizer():
-    return AutoModelForCausalLM.from_pretrained("bigscience/bloom-560m"), AutoTokenizer.from_pretrained(
-        "bigscience/bloom-560m"
-    )
+    model = GPT2LMHeadModel(config=GPT2Config(n_layer=6))
+    tokenizer = AutoTokenizer.from_pretrained("gpt2")
+    return model, tokenizer
 
 
 def get_bloom_and_tokenizer_with_6_layers():
@@ -87,7 +84,6 @@ def run_model_partitioner(
     [
         get_gpt2_and_tokenizer,
         get_bloom_and_tokenizer_with_6_layers,
-        get_bloom_560m_and_tokenizer,
     ],
 )
 def test_naive_partitioning(pipeline_parallel_size, model_retrieval_func):