Axial Attention in Multidimensional Transformers参考文献翻译
Ba, J. L., Kiros, J. R., & Hinton, G. E. (2016). Layer normalization. arXiv preprint arXiv:1607.06450. 中文翻译:Ba, J. L., Kiros, J. R., & Hinton, G. E. (2016). 层归一化. arXiv 预印本 arXiv:1607.06450. Chen, X., Mishra, N., Rohaninejad,…
2025-06-06