Petrov, N. and Andersson, S. (2026) “Sparse Experts Scale Better in Efficient Mixture Architectures for Trillion Parameter Models”, Computer Life, 14(2), pp. 16–22. doi:10.54097/baczzj49.