feat: support aten.index_put converter except accumulate True

chohk88 · chohk88 · commit 77c1d8f5914c · 2024-06-13T13:50:25.000+09:00
diff --git a/py/torch_tensorrt/dynamo/conversion/aten_ops_converters.py b/py/torch_tensorrt/dynamo/conversion/aten_ops_converters.py
@@ -769,6 +769,22 @@ def aten_ops_select(
     )
 
 
+def index_put_accumulate_validator(node: Node) -> bool:
+    if args_bounds_check(node.args, 3, False):
+        _LOGGER.debug("We do not support accumulate=True for aten.index_put operation")
+        return False
+    else:
+        return True
+
+
+@dynamo_tensorrt_converter(
+    torch.ops.aten.index_put_.default,
+    capability_validator=index_put_accumulate_validator,
+)
+@dynamo_tensorrt_converter(
+    torch.ops.aten.index_put.default,
+    capability_validator=index_put_accumulate_validator,
+)
 @dynamo_tensorrt_converter(torch.ops.aten.index_put.default)
 @dynamo_tensorrt_converter(torch.ops.aten.index_put_.default)
 @enforce_tensor_types(
@@ -777,7 +793,7 @@ def aten_ops_select(
         2: (TRTTensor,),
     }
 )
-def aten_ops_index_put_(
+def aten_ops_index_put(
     ctx: ConversionContext,
     target: Target,
     args: Tuple[Argument, ...],
@@ -792,7 +808,7 @@ def aten_ops_index_put_(
         args[0],
         args[1],
         args[2],
-        args_bounds_check(args, 3, []),
+        args_bounds_check(args, 3, False),
     )
 
 
@@ -3208,27 +3224,6 @@ def aten_ops_roll(
     )
 
 
-@enforce_tensor_types(
-    {
-        0: (TRTTensor,),
-    }
-)
-@dynamo_tensorrt_converter(torch.ops.aten.scatter.src)
-# @dynamo_tensorrt_converter(torch.ops.aten.scatter.src.default)
-@dynamo_tensorrt_converter(torch.ops.aten.scatter.value)
-# @dynamo_tensorrt_converter(torch.ops.aten.scatter.value.default)
-def aten_ops_scatter(
-    ctx: ConversionContext,
-    target: Target,
-    args: Tuple[Argument, ...],
-    kwargs: Dict[str, Argument],
-    name: str,
-) -> Union[TRTTensor, Sequence[TRTTensor]]:
-    return impl.select.scatter(
-        ctx, target, SourceIR.ATEN, name, args[0], args[1], args[2], args[3]
-    )
-
-
 @dynamo_tensorrt_converter(torch.ops.aten.index_select.default)
 @enforce_tensor_types(
     {
diff --git a/py/torch_tensorrt/dynamo/conversion/impl/select.py b/py/torch_tensorrt/dynamo/conversion/impl/select.py
@@ -6,6 +6,7 @@
 import torch
 from torch.fx.node import Target
 from torch_tensorrt.dynamo._SourceIR import SourceIR
+from torch_tensorrt.dynamo.conversion import impl
 from torch_tensorrt.dynamo.conversion._ConversionContext import ConversionContext
 from torch_tensorrt.dynamo.conversion.converter_utils import (
     broadcastable,
@@ -410,7 +411,7 @@ def scatter(
     dim = get_positive_dim(dim, len(input_shape))
     src_tensor = src
     # scatter.value
-    if isinstance(src, int) or isinstance(src, float):
+    if isinstance(src, (int, float)):
         src_tensor = get_trt_tensor(
             ctx, src * np.ones(index_shape_list), name + "_value_tensor"
         )
@@ -440,33 +441,28 @@ def index_put_converter(
     values: TRTTensor,
     accumulate: bool = False,
 ) -> TRTTensor:
-    from torch_tensorrt.dynamo.conversion import impl
-
-    trt_inputs = []
+    # Reshape indices to add an extra dimension if necessary (indices is a Tuple of ITensors)
+    reshaped_indices = []
     for i, each_input in enumerate(indices):
         if not isinstance(each_input, TRTTensor):
             each_input = get_trt_tensor(ctx, each_input, f"{name}_tensor_{i}")
         each_input = impl.shuffle.reshape(
             ctx,
             target,
             source_ir,
-            f"{name}_broadcast_{i}",
+            f"{name}_reshape_{i}",
             each_input,
-            (each_input.shape[0],),
+            (-1, 1),  # Reshape to (N, 1)
         )
-        trt_inputs.append(each_input)
-    concat_layer = ctx.net.add_concatenation(trt_inputs)
-    dim = get_positive_dim(0, len(indices[0].shape))
-    concat_layer.axis = dim
-    set_layer_name(concat_layer, target, f"{name}_gather", source_ir)
-    indices = concat_layer.get_output(0)
-
-    values = impl.shuffle.reshape(
-        ctx, target, source_ir, f"{name}_broadcast", values, (values.shape[0],)
+        reshaped_indices.append(each_input)
+
+    # Concatenate along the second dimension (columns)
+    indices_cat = impl.cat.cat(
+        ctx, target, source_ir, f"{name}_cat", reshaped_indices, dim=1
     )
 
     scatter_layer = ctx.net.add_scatter(
-        input_tensor, indices, values, trt.ScatterMode.ELEMENT  # trt.ScatterMode.ND
+        input_tensor, indices_cat, values, trt.ScatterMode.ND
     )
     scatter_layer.axis = 0
     set_layer_name(scatter_layer, target, f"{name}_scatter_layer", source_ir)
diff --git a/tests/py/dynamo/conversion/test_index_put_aten.py b/tests/py/dynamo/conversion/test_index_put_aten.py
@@ -22,11 +22,140 @@ class TestIndexPutConverter(DispatchTestCase):
                 indices_tensor=(torch.tensor([0, 3], dtype=torch.int32),),
                 value_tensor=torch.tensor([1, 3], dtype=torch.int32),
             ),
+            param(
+                test_name="2d_indices_single",
+                source_tensor=torch.zeros([5, 5], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([2], dtype=torch.int32),
+                    torch.tensor([0], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([3], dtype=torch.int32),
+            ),
+            param(
+                test_name="2d_indices_multiple",
+                source_tensor=torch.zeros([5, 5], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([0, 2, 2], dtype=torch.int32),
+                    torch.tensor([2, 0, 2], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([1, 3, 4], dtype=torch.int32),
+            ),
+            param(
+                test_name="3d_indices_single",
+                source_tensor=torch.zeros([3, 3, 3], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([1], dtype=torch.int32),
+                    torch.tensor([2], dtype=torch.int32),
+                    torch.tensor([2], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([7], dtype=torch.int32),
+            ),
+            param(
+                test_name="3d_indices_multiple",
+                source_tensor=torch.zeros([3, 3, 3], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([0, 1, 1], dtype=torch.int32),
+                    torch.tensor([1, 2, 1], dtype=torch.int32),
+                    torch.tensor([2, 0, 2], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([5, 7, 2], dtype=torch.int32),
+            ),
+            param(
+                test_name="4d_indices_single",
+                source_tensor=torch.zeros([2, 2, 2, 2], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([1], dtype=torch.int32),
+                    torch.tensor([1], dtype=torch.int32),
+                    torch.tensor([0], dtype=torch.int32),
+                    torch.tensor([1], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([5], dtype=torch.int32),
+            ),
+            param(
+                test_name="4d_indices_multiple",
+                source_tensor=torch.zeros([2, 2, 2, 2], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([0, 1], dtype=torch.int32),
+                    torch.tensor([1, 1], dtype=torch.int32),
+                    torch.tensor([1, 0], dtype=torch.int32),
+                    torch.tensor([1, 0], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([5, 7], dtype=torch.int32),
+            ),
+            param(
+                test_name="negative_indices",
+                source_tensor=torch.zeros([5, 5], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([-1, -2], dtype=torch.int32),
+                    torch.tensor([2, 0], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([1, 3], dtype=torch.int32),
+            ),
+            param(
+                test_name="mixed_indices",
+                source_tensor=torch.zeros([4, 4], dtype=torch.int32),
+                indices_tensor=(
+                    torch.tensor([0, 1, -1, -2], dtype=torch.int32),
+                    torch.tensor([0, -1, 2, 1], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([2, 4, 6, 8], dtype=torch.int32),
+            ),
+            param(
+                test_name="1d_indices_float",
+                source_tensor=torch.zeros([5], dtype=torch.float32),
+                indices_tensor=(torch.tensor([0, 3], dtype=torch.int32),),
+                value_tensor=torch.tensor([1.5, 3.5], dtype=torch.float32),
+            ),
+            param(
+                test_name="2d_indices_float",
+                source_tensor=torch.zeros([5, 5], dtype=torch.float32),
+                indices_tensor=(
+                    torch.tensor([0, 2], dtype=torch.int32),
+                    torch.tensor([2, 0], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([1.5, 3.5], dtype=torch.float32),
+            ),
+            param(
+                test_name="3d_indices_float",
+                source_tensor=torch.zeros([3, 3, 3], dtype=torch.float32),
+                indices_tensor=(
+                    torch.tensor([0, 1], dtype=torch.int32),
+                    torch.tensor([1, 2], dtype=torch.int32),
+                    torch.tensor([2, 0], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([5.5, 7.5], dtype=torch.float32),
+            ),
+            param(
+                test_name="4d_indices_float",
+                source_tensor=torch.zeros([2, 2, 2, 2], dtype=torch.float32),
+                indices_tensor=(
+                    torch.tensor([0, 1], dtype=torch.int32),
+                    torch.tensor([1, 0], dtype=torch.int32),
+                    torch.tensor([0, 1], dtype=torch.int32),
+                    torch.tensor([1, 0], dtype=torch.int32),
+                ),
+                value_tensor=torch.tensor([5.5, 7.5], dtype=torch.float32),
+            ),
+            # param(
+            #     test_name="2d_indices_accumulate_True",
+            #     source_tensor=torch.zeros([5, 5], dtype=torch.int32),
+            #     indices_tensor=(torch.tensor([0, 0], dtype=torch.int32), torch.tensor([1, 1], dtype=torch.int32)),
+            #     value_tensor=torch.tensor([1, 2], dtype=torch.int32),
+            #     accumulate=True,
+            # ),
+            # param(
+            #     test_name="3d_indices_accumulate_True",
+            #     source_tensor=torch.zeros([3, 3, 3], dtype=torch.int32),
+            #     indices_tensor=(torch.tensor([0, 0], dtype=torch.int32), torch.tensor([1, 1], dtype=torch.int32), torch.tensor([2, 2], dtype=torch.int32)),
+            #     value_tensor=torch.tensor([1, 2], dtype=torch.int32),
+            #     accumulate=True,
+            # ),
             # param(
-            #     test_name="2d_indices",
-            #     source_tensor=torch.zeros([5,5], dtype=torch.int32),
-            #     indices_tensor=(torch.tensor([0,2], dtype=torch.int32),torch.tensor([2,0], dtype=torch.int32),),
-            #     value_tensor=torch.tensor([1,3], dtype=torch.int32),
+            #     test_name="4d_indices_accumulate_True",
+            #     source_tensor=torch.zeros([2, 2, 2, 2], dtype=torch.int32),
+            #     indices_tensor=(torch.tensor([0, 0], dtype=torch.int32), torch.tensor([1, 1], dtype=torch.int32), torch.tensor([0, 0], dtype=torch.int32), torch.tensor([1, 1], dtype=torch.int32)),
+            #     value_tensor=torch.tensor([1, 2], dtype=torch.int32),
+            #     accumulate=True,
             # ),
         ]
     )
@@ -36,7 +165,7 @@ def test_index_put(
         class TestIndexPut(torch.nn.Module):
             def forward(self, source_tensor, value_tensor):
                 return torch.ops.aten.index_put_.default(
-                    source_tensor, indices_tensor, value_tensor
+                    source_tensor, indices_tensor, value_tensor, accumulate
                 )
 
         self.run_test(