新增OP¶

如果需要的算子不在算子列表中，则需要通过以下步骤添加新的算子。

添加算子解析
添加Layer实现
添加LayerAcc实现
添加单元测试

1. 添加算子解析 ¶

1.1 添加算子参数¶

添加LayerType（1）修改文件 <path_to_TNN>/source/tnn/core/layer_type.h，在LayerType中添加新算子的枚举，格式为LAYER_XXX。（2）修改文件 <path_to_TNN>/source/tnn/core/layer_type.cc，在global_layer_type_map中添加新算子枚举值对应的算子名称，此名称与proto文件中层的名称一致。
添加LayerParam如果新算子在proto里除了输入输出blob，还有其他参数，则需要添加LayerParam，修改文件 <path_to_TNN>/source/tnn/interpreter/layer_param.h，添加类似ConvLayerParam的结构，继承于LayerParam

 struct ConvLayerParam : public LayerParam {
     int pad_type = -1;
     // input channels of blob, divide by group
     int input_channel = 0;
     // the total output channels of blob, not devide by group
     int output_channel = 0;
     //[w_begin w_end h_begin h_end d_begin d_end]
     std::vector<int> pads;
     // order [w h d]
     std::vector<int> kernels;
     // order [w h d]
     std::vector<int> strides;
     // order [w h d]
     std::vector<int> dialations;
     int group           = 1;
     int bias            = 0;
     int activation_type = ActivationType_None;
 };

添加LayerResource如果新算子有需要保存到model里的参数，则需要添加LayerResource，修改文件 <path_to_TNN>/source/tnn/interpreter/layer_resource.h，添加类似ConvLayerResource的结构，继承于LayerResource

 struct ConvLayerResource : public LayerResource {
     // conv layer filter format
     ConvLayerFilterFormat filter_format = OIHW;

     // conv layer handle
     // NOTE: for deconv, the weight's default format is  [n][i][o][h][w]
     RawBuffer filter_handle;

     // bias handle
     RawBuffer bias_handle;

     // extra scale handle for different precision
     RawBuffer scale_handle;
 };

1.2 添加LayerInterpreter¶

如果新算子添加了LayerParam或者LayerResource，则需要添加对应的LayerInterpreter。在文件夹<path_to_TNN>/source/tnn/interpreter/tnn/layer_interpreter下添加对应的实现。（1）通过DECLARE_LAYER_INTERPRETER()声明新算子的Interpreter；（2）通过REGISTER_LAYER_INTERPRETER()注册新算子的Interpreter；（3）实现以下接口：

InterpretProto() – 解析新算子的LayerParam
InterpretResource() – 解析新算子的LayerResource
SaveProto() – 保存新算子的LayerParam
SaveResource() – 保存新算子的LayerResource

2. 添加Layer实现 ¶

在文件夹 <path_to_TNN>/source/tnn/layer 下添加对应layer的实现。（1）DECLARE_LAYER() 声明新算子的Layer实现；（2）REGISTER_LAYER() 注册新算子的Layer实现；（3）实现以下接口：

InferOutputDataType() – 设置对应层输出Blob的数据类型
InferOutputShape() – 计算对应层输出Blob的大小

3. 添加LayerAcc实现 ¶

每个新的算子都需要实现对应设备的LayerAcc。

3.1 CPU平台¶

在文件夹<path_to_TNN>/source/tnn/device/cpu/acc下添加对应算子的LayerAcc实现。（1）DECLARE_CPU_ACC() 声明新算子的LayerAcc实现；（2）REGISTER_CPU_ACC() 注册新算子的LayerAcc实现；（3）实现以下接口：

Forward() – 新算子的cpu实现；

3.2 ARM平台¶

在文件夹<path_to_TNN>/source/tnn/device/arm/acc下添加对应算子的LayerAcc实现。（1）声明新算子的LayerAcc实现，如果没有特殊的参数，可以直接使用DECLARE_ARM_ACC()声明；（2）REGISTER_ARM_ACC() 注册新算子的LayerAcc实现；（3）实现以下接口：

Init() – 对LayerParam和LayerResource进行处理；
Reshape() – 实现在输入blob大小改变的情况下的逻辑；
Forward() – 新算子的ARM实现；

3.3 OpenCL平台¶

在文件夹<path_to_TNN>/source/tnn/device/opencl/acc下添加对应算子的LayerAcc实现。（1）声明新算子的LayerAcc实现，如果没有特殊的参数，可以直接使用DECLARE_OPENCL_ACC()声明；（2）REGISTER_OPENCL_ACC() 注册新算子的LayerAcc实现；（3）实现以下接口：

Init() – 对LayerParam和LayerResource进行处理，创建OpenCL的kernel；
Reshape() – 实现在输入blob大小改变的情况下的逻辑，对于OpenCL，在此处调用SegArgs设置kernel参数；
Forward() – 执行OpenCL的kernel；

（4）实现OpenCL的kernel，在目录 <path_to_TNN>/source/tnn/device/opencl/cl 添加对应的kernel文件，以.cl为后缀。添加之后需要执行脚本:

python opencl_codegen.py

3.4 Metal平台¶

在文件夹<path_to_TNN>/source/tnn/device/metal/acc下添加对应算子的LayerAcc实现。（1）声明新算子的LayerAcc实现，如果没有特殊的参数，可以直接使用DECLARE_METAL_ACC()声明；（2）REGISTER_METAL_ACC() 注册新算子的LayerAcc实现；（3）实现以下接口：

Init()
Reshape()
Forward()

（4）实现Metal的kernel，在目录 <path_to_TNN>/source/tnn/device/metal/acc 添加对应的metal文件，以.metal为后缀。

3.5 NPU平台¶

在文件夹<path_to_TNN>/source/tnn/device/huawei_npu/convert下添加对应算子的LayerConvert实现。（1）声明新算子的LayerConvert实现，如果没有其他权重input，可以直接使用DECLARE_NPU_LAYER声明；（2）REGISTER_NPU_LAYER 注册新算子的LayerConvert实现；（3）实现以下接口：

Convert() – 使用ir翻译tnn模型算子；

4. 添加单元测试 ¶

在文件夹 <path_to_TNN>/test/unit_test/layer_test 下添加对应层的单元测试文件。