Skip to content

ArtIntAI/mlu-ops-generator

 
 

Repository files navigation

Generator模块介绍和使用说明

mlu-ops-generator 是一个测例生成框架,主要作用是解析 json 格式的配置文件,然后生成本地的单元测试用例,保存测试用例的格式文件可以是 pb 或者 prototxt 。 主要包含 random 模块和 manual 模块。

1. Generator 主流程介绍

file

2. Manual 模块介绍

  • MluOpBuilder

MluOpBuilder 负责构建整个流程,会调用 input_parser 模块解析 json 文件生成测试用例的参数信息,然后调用 MluOpGenerator 模块生成 baseline 。


  • MluOpGenerator

    MluOpGenerator 负责核心的计算逻辑,主要包括:

    • 算子在 TensorListFactory 工厂中注册自己的 TensorList 类,然后该 TensorList 类重载随机数初始化,Tensor 间形状规模等逻辑

    • 算子在 OpTestFactory 工厂中注册自己的 OpTest 类,然后该 OpTest 中重载 compute 的逻辑

    • 算子在 ProtoWriterFactory 工厂中注册自己的 ProtoWriter 类,然后该 ProtoWriter 类重载 dumpOpParam2Node 的逻辑


  • TensorList

    TensorList 是默认的 TensorList 基类,主要用来处理 Tensor 间的依赖关系,初始化随机数。


  • OpTest

    OpTest 是默认的 OpTest 的基类,主要是提供 compute ,param check 接口,新算子必须继承 OpTest 实现自己的 compute 接口。


  • ProtoWriter

    主要包括:

    • 保存公共部分的参数到 Node

    • 保存 Tensor 信息到 Node

    • 保存 Op Param 信息到 Node

    • 将 Node 内容保存到 pb/prototxt 文件


3. Random 模块介绍

Random 模块主要功能是解析配置的 random json,来生成manual json 以 div 算子为例:

  • RandomParser

    • Tensor 的形状随机,支持三种随机方式,全随机,部分随机,不随机

    • dtype、layout 随机

    其中 dtype 支持的类型有:half、float、int8、int16、int32、int64、double、uint8、uint16、uint32、uint64、bool、complex_half、complex_float、complex_double 。

    其中 layout 支持的类型有:NCHW、NHWC、HWCN、NDHWC、ARRAY、TNC、NTC、NCDHW、NC、NLC 。


4. 如何给一个算子添加测例

4.1 本地环境配置

根据 compute 中第三方计算库的依赖,安装对应的环境,以 div 算子为例:

采用 tensorflow 的计算结果作为 baseline ,需要安装 tensorflow 相关环境。


4.2 添加算子的计算逻辑

添加在 GPU/CPU 上的计算逻辑,对应文件写在 nonmlu_ops/xxx (算子名) 路径下,以 div 算子为例:

添加 nonmlu_ops/div/compute.py 。


4.3 撰写 Manual 格式的 Json 文件

新增 manual 配置文件的路径为 manual_config/mlu_ops/xxx (算子名),config 文件以 xxx_manual.json 命名,要求 manual 模块生成的测例,能正确通过 GTest 测试。以 div 算子为例:

添加 manual_config/div/div_manual.json,执行:

python run_manual.py div  # 生成div算子的pb测例
运行参数 功能说明
--json_path 多个算子的json文件夹的根目录,默认值为./manual_config,支持一次生成多个算子的测试用例
--json_file 单个manual.json的文件名,表示只根据这个指定的json文件生成测试用例
--prototxt_path 用于指定保存测试用例的路径,默认存到与run_manual.py同级的generated_testcases文件夹内
--save_txt 是否生成pb的同时生成prototxt文件,默认不生成prototxt文件

4.4 撰写 Random 格式的 Json 文件

新增 random 配置文件的路径为 random2manual/random_config/xxx (算子名),config 文件以 xxx_random.json 命名,要求 random 模式下生成的 json 文件,能作为 manual 模块的输入使用,并正确生成测试用例。以 div 算子为例:

添加 random2manual/random_config/div/div_random.json ,执行:

cd random2manual
python random2manual.py div  # 生成div算子的manual json
运行参数 功能说明
--json_path 手写的random json文件夹的根目录,默认值为./random_config
--save_path 生成的 manual json文件的保存目录,默认值为./generator_manual

random.json的demo如下:

{
 "op_name":"sample",
 "evaluation_criterion":["diff1","diff2"],
 "evaluation_threshold":[0.003,0.003],
 "inputs":[
 {
  "total_random":{"dim_range":[3,8], "value_range":[1,1024],"size":2}, //表示形状维度和维度大小都随机生成
       "dtype":["float16","float32"],  //支持的数据类型组合
       "random_distribution":{"uniform":[-1,1]}, //生成随机数的方式
       "layout":["NCHW","NHWC"]  //支持的layout组合
     },
      {
      "part_random":{
          "part_shape":[1,0,0,3],  //形状部分随机,第二维和第三维随机生成
          "random_values":[
              {"mode":0, "params":[1,4]},  //第二维按照值组合的方式生成,大小是1或4
              {"mode":1, "params":[16,25,8]}  //第三维按照步长随机的方式,下限为16,上限为25,步长为8,取值结果是:[16,24]
          ]
      },
      "random_distribution":{"uniform":[-0.1,0.1]},
      "layout":["ARRAY"],
      "dtype":["float32"]
  },
  {
    "shape":[64,7,7,3],  //形状固定,不随机
    "dtype":["float32"],
    "random_distribution":{"uniform":[-0.1,0.1]},
    "layout":["ARRAY"]
  }
   ],
   "outputs": [
     "dtype":["float16","float32"],
     "layout": ["NCHW"],
   ],
   "op_params": [
     {
       "pad":{
         "total_random":{"dim_range":[4,4],"value_range":[1,1024],"size":2},
         "param_dtype":"int"
       }
     },
     {
       "stride":{
         "part_random":{
           "part_shape":[2,0],
           "random_values":[{"mode":0,"params":[4,8]}]
         },
         "param_dtype":"int"
       }
     },
     {
       "dilation":{
         "shape":[2,2],
         "param_dtype":"int"
       }
     }
   ],
}

4.5 生成 mlu_op_test.proto 对应的 python 代码

GTestGenerator 的 mlu_op_test.proto 文件必须一致 执行:

cd mlu_op_test_proto
protoc mlu_op_test.proto --python_out=./   # 下载代码或者修改 proto 文件后,此处必须执行

5. Json 参数使用说明

  • 全局参数

参数名 说明 示例
op_name op_name 需与 proto 中新增的算子名保持一致,必填 “op_name” : " div"
evaluation_criterion, evaluation_threshold diff 率的计算方式和静态阈值,必填 "evaluation_criterion":["diff1","diff2"],"evaluation_threshold":["0.003","0.003]
device cpu、gpu 用来区分用什么设备计算 baseline ”device“: "gpu"
random_distribution 随机数据参数,用来说明 input 的输入数据值采用哪种方式生成,必填 ”random_distribution“:{"uniform":[-1,1]}
contain_nan tensor 生成随机数时是否包含 nan 数据,默认:false ”contain_nan“ : true
contain_inf tensor 生成随机数时是否包含 inf 数据,默认:false ”contain_inf“ : true
  • Tensor参数

参数名 说明 示例
shape tensor 的形状 ”shape“ : [1,224,224,3]
dtype tensor 的数据类型,可参考 RandomParser 支持的数据类型章节 ”dtype“ : "float32"
layout tensor 的 layout 信息,可参考 RandomParser 支持的数据类型章节 ”layout“ : "NHWC"
random_distribution 同全局参数

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%