Portfolio

Education

MA in Quantitative Methods in the Social Sciences (Concentration: Data Science), Columbia University, Graduate School of Arts and Sciences (GSAS)
MPA in International Affairs (Specializations: United Nations Studies, International Conflict Resolution), Columbia University, School of International & Public Affairs (SIPA)
BA in Political Science (Concentration: International Affairs), Northwestern University

Work Experience

Data Scientist Intern @ Volkswagen Group of America (VGoA) - Belmont, CA - 2022-2023
SIPA Capstone Project Consultant @ International Peace Institute (IPI) - New York, NY - 2020
Protection of Civilians (PoC) Team Intern, Division of Policy, Evaluation, and Training @ United Nations Department of Peace Operations (UN DPO) - New York, NY - 2019
Refugee Status Determination (RSD) Intern @ United Nations High Commissioner for Refugees (UNHCR) - Cairo, Egypt - 2016

Conflict Data Science Projects

GIS & Spatial Analysis:
- Title: "Examining Geospatial Covariate Relationships with Civilian Killings in South Sudan’s Civil War"
  - Focus: Geospatial Statistics Technology Used: QGIS, R, GeoDa
  - Contents: Geospatial interpolation, hot spot analysis, Moran's I calculation, Moran's I residual analysis, Lagrange Multiplier (LM) and Robust LM lag and error diagnostics, and Spatial Durbin models.
Data Visualization:
- Title: "UNAMID: Did the UN’s Withdrawal from Darfur Lead to More Violence against Civilians?"
- Version showing all code
- Version not showing code
  - Focus: GIS Mapping
  - Technology Used: R Markdown, ggmap, tmap, sp, sf, rgdal, stadia/stamen maps, plotly, dplyr, ggplot2, ggthemes, ggpubr, stringr, scales, and kableExtra
  - Contents: Interactive and static charts, GIS maps, heat map tables, density maps, and union buffers and using statistics within them
Natural Language Processing (NLP):
- Title: "Using News Articles to Predict Political Violence in Nigeria"
  - Focus: NLP for Time-Series Forecasting
  - Technology Used: Python, TF-IDF word transformation, NLTK library, Scikit-Learn machine learning models, Scikit-Learn's TimeSeriesSplit, Augmented Dickey-Fuller Test, first-differencing, lags
  - Contents: Converting news articles by publishing date into time-series machine elarning forecasting models. Performance comparison between Ridge, Lasso, Random Forest, and XGBoost regression models
- Title: "LDA Topic Modeling & VADER Sentiment Analysis for Political News Articles on Nigeria"
- Primary document (Python)
- Visualization for the project (R)
  - Focus: Topic Modeling & Sentiment Analysis
  - Technology Used: Python, R Markdown, Excel, NLTK for stopwords, PorterStemmer, and PunktSentenceTokenizer, gensim library for CoherenceModel, LdaModel, and corpora, Jaccard similarity, vaderSentiment library, itertools, ggplot2
  - Contents: Text data cleaning, Latent Dirichlet Allocation (LDA) topic modeling of Nigerian news article text, VADER (Valence Aware Dictionary for Sentiment Reasoning) sentiment analysis scores for articles containing specific political words, compared across quarters of the year.

Non-Conflict Data Science Projects

CNN Deep Learning for Medical Imaging:
- Title: "Comparative Analysis of CNN Deep Learning Models for X-ray Illness Classification"
  - Focus: Deep Learning for Image Classification
  - Technology Used: Python, Keras, CNNs, Transfer Learning, ImageDataGenerator, flow_from_directory, EarlyStopping, ModelCheckpoint, ReduceLROnPlateau
  - Contents: Comparing the performance of 8 CNN deep learning models on X-ray images from three classes (COVID-19, viral pneumonia, and healthy). These include transfer learning models (e.g., InceptionV3), and various techniques to improve model generalization and help avoid overfitting (e.g., dropout, batch normalization, early stopping, data augmentation, L1 and L2 regularization, fire modules, and ways of using deep networks effectively). I also demonstrate best practices for structuring filters/kernels, channels, layers, activation functions, pooling, convolutional blocks, and other model components for optimal performance. Metrics include confusion matrixes, accuracy, precision, recall, F1-score, ROC curve, and AUC. Analysis of non-augmented vs. augmented data models with specific augmentation techniques are shown. Architectures and training strategies for each model are detailed.

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
Data Viz-Darfur Violence as UN Left		Data Viz-Darfur Violence as UN Left
Data Viz-Political Violence in Nigeria		Data Viz-Political Violence in Nigeria
GIS-Attacks on Civilians-South Sudan		GIS-Attacks on Civilians-South Sudan
GIS		GIS
ML-Classifying Imbalanced Spam		ML-Classifying Imbalanced Spam
ML-Predicting Violence with News		ML-Predicting Violence with News
NLP-Topic Models & Sentiment		NLP-Topic Models & Sentiment
NLP		NLP
Neural Network Models		Neural Network Models
.gitattributes		.gitattributes
1.png		1.png
README.md		README.md
_config.yml		_config.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Portfolio

Education

Work Experience

Conflict Data Science Projects

Non-Conflict Data Science Projects

About

Releases

Packages

Languages

roboswell/portfolio

Folders and files

Latest commit

History

Repository files navigation

Portfolio

Education

Work Experience

Conflict Data Science Projects

Non-Conflict Data Science Projects

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages