使用nsys和torch profiler进行性能分析