permute_fp16.cpp 850 Bytes