Publish MERGE INSERT columns as ObjectName; no semantic validation

2025-12-23 11:12:51 +00:00 · 2025-11-25 17:45:49 +01:00 · 2025-11-25 17:45:49 +01:00 · 43a6ab1885
commit 43a6ab1885
parent 9fcfeed605
8 changed files with 83 additions and 207 deletions
--- a/src/ast/dml.rs
+++ b/src/ast/dml.rs
@ -539,7 +539,7 @@ pub struct MergeInsertExpr {
    /// INSERT (product, quantity) VALUES(product, quantity)
    /// INSERT (product, quantity) ROW
    /// ```
-    pub columns: Vec<Ident>,
+    pub columns: Vec<ObjectName>,
    /// The token, `[VALUES | ROW]` starting `kind`.
    pub kind_token: AttachedToken,
    /// The insert type used by the statement.
--- a/src/ast/mod.rs
+++ b/src/ast/mod.rs
@ -347,6 +347,12 @@ impl From<Vec<Ident>> for ObjectName {
    }
 }

+impl From<Ident> for ObjectName {
+    fn from(ident: Ident) -> Self {
+        ObjectName(vec![ObjectNamePart::Identifier(ident)])
+    }
+}
+
 impl fmt::Display for ObjectName {
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
        write!(f, "{}", display_separated(&self.0, "."))
--- a/src/ast/spans.rs
+++ b/src/ast/spans.rs
@ -2436,7 +2436,7 @@ impl Spanned for MergeInsertExpr {
            ]
            .into_iter()
            .chain(self.insert_predicate.iter().map(Spanned::span))
-            .chain(self.columns.iter().map(|i| i.span)),
+            .chain(self.columns.iter().map(|i| i.span())),
        )
    }
 }
--- a/src/dialect/mod.rs
+++ b/src/dialect/mod.rs
@ -634,6 +634,15 @@ pub trait Dialect: Debug + Any {
    /// ```
    /// or
    /// ```sql
+    /// MERGE INTO FOO
+    /// USING FOO_IMP
+    ///    ON (FOO.ID = FOO_IMP.ID)
+    ///  WHEN NOT MATCHED THEN
+    ///      -- here: qualified with array subscripts
+    ///      INSERT (FOO.ID[1], FOO.NAME[1:12])
+    ///      VALUES (FOO_IMP.ID, UPPER(FOO_IMP.NAME))
+    /// or
+    /// ```sql
    /// MERGE INTO FOO X
    /// USING FOO_IMP
    ///    ON (X.ID = FOO_IMP.ID)
@ -643,9 +652,6 @@ pub trait Dialect: Debug + Any {
    ///      VALUES (FOO_IMP.ID, UPPER(FOO_IMP.NAME))
    /// ```
    ///
-    /// Note: in the latter case, the qualifier must match the target table
-    /// name or its alias if one is present. The parser will enforce this.
-    ///
    /// The default implementation always returns `false` not allowing the
    /// qualifiers.
    fn supports_merge_insert_qualified_columns(&self) -> bool {
--- a/src/dialect/postgresql.rs
+++ b/src/dialect/postgresql.rs
@ -280,4 +280,12 @@ impl Dialect for PostgreSqlDialect {
    fn supports_interval_options(&self) -> bool {
        true
    }
+
+    /// [Postgres] supports column names with a subfield name or an array
+    /// subscript in the MERGE INSERT column lists.
+    ///
+    /// [Postgres]: https://www.postgresql.org/docs/current/sql-merge.html
+    fn supports_merge_insert_qualified_columns(&self) -> bool {
+        true
+    }
 }
--- a/src/parser/merge.rs
+++ b/src/parser/merge.rs
@ -17,14 +17,12 @@ use alloc::{boxed::Box, format, string::ToString, vec, vec::Vec};

 use crate::{
    ast::{
-        Ident, Merge, MergeAction, MergeClause, MergeClauseKind, MergeInsertExpr, MergeInsertKind,
-        MergeUpdateExpr, ObjectName, ObjectNamePart, OutputClause, SetExpr, Spanned, Statement,
-        TableFactor,
+        Merge, MergeAction, MergeClause, MergeClauseKind, MergeInsertExpr, MergeInsertKind, MergeUpdateExpr, ObjectName, ObjectNamePart, OutputClause, SetExpr, Statement
    },
    dialect::{BigQueryDialect, GenericDialect, MySqlDialect},
    keywords::Keyword,
    parser::IsOptional,
-    tokenizer::{Location, TokenWithSpan},
+    tokenizer::TokenWithSpan,
 };

 use super::{Parser, ParserError};
@ -49,7 +47,7 @@ impl Parser<'_> {
        let source = self.parse_table_factor()?;
        self.expect_keyword_is(Keyword::ON)?;
        let on = self.parse_expr()?;
-        let clauses = self.parse_merge_clauses(&table)?;
+        let clauses = self.parse_merge_clauses()?;
        let output = match self.parse_one_of_keywords(&[Keyword::OUTPUT, Keyword::RETURNING]) {
            Some(keyword) => Some(self.parse_output(keyword, self.get_current_token().clone())?),
            None => None,
@ -66,10 +64,7 @@ impl Parser<'_> {
        }))
    }

-    fn parse_merge_clauses(
-        &mut self,
-        target_table: &TableFactor,
-    ) -> Result<Vec<MergeClause>, ParserError> {
+    fn parse_merge_clauses(&mut self) -> Result<Vec<MergeClause>, ParserError> {
        let mut clauses = vec![];
        loop {
            if !(self.parse_keyword(Keyword::WHEN)) {
@ -172,11 +167,7 @@ impl Parser<'_> {
                    let insert_token = self.get_current_token().clone();
                    let is_mysql = dialect_of!(self is MySqlDialect);

-                    let columns = self.parse_merge_clause_insert_columns(
-                        target_table,
-                        &clause_kind,
-                        is_mysql,
-                    )?;
+                    let columns = self.parse_merge_clause_insert_columns(is_mysql)?;
                    let (kind, kind_token) = if dialect_of!(self is BigQueryDialect | GenericDialect)
                        && self.parse_keyword(Keyword::ROW)
                    {
@ -220,67 +211,27 @@ impl Parser<'_> {
        Ok(clauses)
    }

-    fn parse_merge_clause_insert_columns(
-        &mut self,
-        target_table: &TableFactor,
-        clause_kind: &MergeClauseKind,
-        allow_empty: bool,
-    ) -> Result<Vec<Ident>, ParserError> {
+    fn parse_merge_clause_insert_columns(&mut self, allow_empty: bool) -> Result<Vec<ObjectName>, ParserError> {
        if self.dialect.supports_merge_insert_qualified_columns() {
-            let cols =
-                self.parse_parenthesized_qualified_column_list(IsOptional::Optional, allow_empty)?;
-            if let TableFactor::Table { name, alias, .. } = target_table {
-                if let Some(alias) = alias {
-                    if alias.columns.is_empty() {
-                        // ~ only the alias is supported at this point
-                        match unqualify_columns(cols, None, Some(&alias.name)) {
-                            Ok(column) => Ok(column),
-                            Err((err, loc)) => parser_err!(
-                                format_args!("Invalid column for INSERT in a {clause_kind} merge clause: {err}"),
-                                loc
-                            ),
-                        }
-                    } else {
-                        parser_err!(
-                            format_args!("Invalid target ALIAS for INSERT in a {clause_kind} merge clause; must be an identifier"),
-                            alias.name.span.start
-                        )
-                    }
-                } else {
-                    // ~ allow the full qualifier, but also just the table name
-                    if name.0.len() == 1 {
-                        match unqualify_columns(cols, Some(name), None) {
-                            Ok(column) => Ok(column),
-                            Err((err, loc)) => parser_err!(
-                                format_args!("Invalid column for INSERT in a {clause_kind} merge clause: {err}"),
-                                loc)
-                        }
-                    } else if let Some(unqualified_name) =
-                        name.0.last().and_then(ObjectNamePart::as_ident)
-                    {
-                        match unqualify_columns(cols, Some(name), Some(unqualified_name)) {
-                            Ok(column) => Ok(column),
-                            Err((err, loc)) => parser_err!(
-                                format_args!("Invalid column for INSERT in a {clause_kind} merge clause: {err}"),
-                                loc)
-                        }
-                    } else {
-                        parser_err!(
-                            format_args!("Invalid target table NAME for INSERT in a {clause_kind} merge clause; must be an identifier"),
-                            name.span().start
-                        )
-                    }
-                }
-            } else {
-                parser_err!(
-                    format_args!("Invalid target for INSERT in a {clause_kind} merge clause; must be a TABLE identifier"),
-                    target_table.span().start)
-            }
+            self.parse_parenthesized_qualified_column_list(IsOptional::Optional, allow_empty)
        } else {
-            self.parse_parenthesized_column_list(IsOptional::Optional, allow_empty)
+            self.parse_parenthesized_column_list_as_object_names(IsOptional::Optional, allow_empty)
        }
    }

+    /// Just like [Parser::parse_parenthesized_column_list] parses a
+    /// parenthesized list of (simple) column names but returns them as object
+    /// names.
+    fn parse_parenthesized_column_list_as_object_names(
+        &mut self,
+        optional: IsOptional,
+        allow_empty: bool,
+    ) -> Result<Vec<ObjectName>, ParserError> {
+        self.parse_parenthesized_column_list_inner(optional, allow_empty, |p| {
+            p.parse_identifier().map(|ident| ObjectName(vec![ObjectNamePart::Identifier(ident)]))
+        })
+    }
+
    fn parse_output(
        &mut self,
        start_keyword: Keyword,
@ -308,96 +259,3 @@ impl Parser<'_> {
        })
    }
 }
-
-/// Helper to unqualify a list of columns with either a qualified prefix
-/// (`allowed_qualifier_1`) or a qualifier identifier (`allowed_qualifier_2`.)
-///
-/// Oracle allows `INSERT ([qualifier.]column_name, ...)` in MERGE statements
-/// with `qualifier` referring to the alias of the target table (if one is
-/// present) or, if no alias is present, to the target table name itself -
-/// either qualified or unqualified.
-fn unqualify_columns(
-    columns: Vec<ObjectName>,
-    allowed_qualifier_1: Option<&ObjectName>,
-    allowed_qualifier_2: Option<&Ident>,
-) -> Result<Vec<Ident>, (&'static str, Location)> {
-    // ~ helper to turn a column name (part) into a plain `ident`
-    // possibly bailing with error
-    fn to_ident(name: ObjectNamePart) -> Result<Ident, (&'static str, Location)> {
-        match name {
-            ObjectNamePart::Identifier(ident) => Ok(ident),
-            ObjectNamePart::Function(_) => Err(("not an identifier", name.span().start)),
-        }
-    }
-
-    // ~ helper to return the last part of `name` if it is
-    // preceded by `prefix`
-    fn unqualify_column(
-        mut name: ObjectName,
-        prefix: &ObjectName,
-    ) -> Result<ObjectNamePart, ObjectName> {
-        let mut name_iter = name.0.iter();
-        let mut prefix_iter = prefix.0.iter();
-        loop {
-            match (name_iter.next(), prefix_iter.next()) {
-                (Some(_), None) => {
-                    if name_iter.next().is_none() {
-                        return Ok(name.0.pop().expect("missing name part"));
-                    } else {
-                        return Err(name);
-                    }
-                }
-                (Some(c), Some(q)) if c == q => {
-                    // ~ continue matching next part
-                }
-                _ => {
-                    return Err(name);
-                }
-            }
-        }
-    }
-
-    let mut unqualified = Vec::<Ident>::with_capacity(columns.len());
-    for mut name in columns {
-        if name.0.is_empty() {
-            return Err(("empty column name", name.span().start));
-        }
-
-        if name.0.len() == 1 {
-            unqualified.push(to_ident(name.0.pop().expect("missing name part"))?);
-            continue;
-        }
-
-        // ~ try matching by the primary prefix
-        if let Some(allowed_qualifier) = allowed_qualifier_1 {
-            match unqualify_column(name, allowed_qualifier) {
-                Ok(ident) => {
-                    unqualified.push(to_ident(ident)?);
-                    continue;
-                }
-                Err(n) => {
-                    // ~ continue trying with the alternate prefix below
-                    name = n;
-                }
-            }
-        }
-
-        // ~ try matching by the alternate prefix
-        if let Some(allowed_qualifier) = allowed_qualifier_2 {
-            if name.0.len() == 2
-                && name
-                    .0
-                    .first()
-                    .and_then(ObjectNamePart::as_ident)
-                    .map(|i| i == allowed_qualifier)
-                    .unwrap_or(false)
-            {
-                unqualified.push(to_ident(name.0.pop().expect("missing name part"))?);
-                continue;
-            }
-        }
-
-        return Err(("not matching target table", name.span().start));
-    }
-    Ok(unqualified)
-}
--- a/tests/sqlparser_bigquery.rs
+++ b/tests/sqlparser_bigquery.rs
@ -1806,7 +1806,7 @@ fn parse_merge() {
    );
    let insert_action = MergeAction::Insert(MergeInsertExpr {
        insert_token: AttachedToken::empty(),
-        columns: vec![Ident::new("product"), Ident::new("quantity")],
+        columns: vec![Ident::new("product").into(), Ident::new("quantity").into()],
        kind_token: AttachedToken::empty(),
        kind: MergeInsertKind::Values(Values {
            value_keyword: false,
@ -1920,7 +1920,7 @@ fn parse_merge() {
                        predicate: Some(Expr::value(number("1"))),
                        action: MergeAction::Insert(MergeInsertExpr {
                            insert_token: AttachedToken::empty(),
-                            columns: vec![Ident::new("product"), Ident::new("quantity"),],
+                            columns: vec![Ident::new("product").into(), Ident::new("quantity").into(),],
                            kind_token: AttachedToken::empty(),
                            kind: MergeInsertKind::Row,
                            insert_predicate: None,
@ -1932,7 +1932,7 @@ fn parse_merge() {
                        predicate: None,
                        action: MergeAction::Insert(MergeInsertExpr {
                            insert_token: AttachedToken::empty(),
-                            columns: vec![Ident::new("product"), Ident::new("quantity"),],
+                            columns: vec![Ident::new("product").into(), Ident::new("quantity").into(),],
                            kind_token: AttachedToken::empty(),
                            kind: MergeInsertKind::Row,
                            insert_predicate: None,
@ -1982,7 +1982,7 @@ fn parse_merge() {
                        predicate: None,
                        action: MergeAction::Insert(MergeInsertExpr {
                            insert_token: AttachedToken::empty(),
-                            columns: vec![Ident::new("a"), Ident::new("b"),],
+                            columns: vec![Ident::new("a").into(), Ident::new("b").into(),],
                            kind_token: AttachedToken::empty(),
                            kind: MergeInsertKind::Values(Values {
                                value_keyword: false,
--- a/tests/sqlparser_common.rs
+++ b/tests/sqlparser_common.rs
@ -1641,6 +1641,10 @@ fn ms_and_generic() -> TestedDialects {
    TestedDialects::new(vec![Box::new(MsSqlDialect {}), Box::new(GenericDialect {})])
 }

+fn only_ms() -> TestedDialects {
+    TestedDialects::new(vec![Box::new(MsSqlDialect {})])
+}
+
 fn only_generic() -> TestedDialects {
    TestedDialects::new(vec![Box::new(GenericDialect {})])
 }
@ -9925,7 +9929,7 @@ fn parse_merge() {
                        predicate: None,
                        action: MergeAction::Insert(MergeInsertExpr {
                            insert_token: AttachedToken::empty(),
-                            columns: vec![Ident::new("A"), Ident::new("B"), Ident::new("C")],
+                            columns: vec![Ident::new("A").into(), Ident::new("B").into(), Ident::new("C").into()],
                            kind_token: AttachedToken::empty(),
                            kind: MergeInsertKind::Values(Values {
                                value_keyword: false,
@ -10096,40 +10100,24 @@ WHERE NOT FOO_IMPORT.NAME LIKE '%.DO_NOT_INSERT'";
    only_generic().verified_stmt(sql);
 }

+#[test]
+fn test_merge_with_insert_simple_columns() {
+    let sql = "\
+MERGE INTO FOO USING FOO_IMPORT ON (FOO.ID = FOO_IMPORT.ID) \
+WHEN NOT MATCHED THEN \
+INSERT (ID, NAME) \
+VALUES (1, 'abc')";
+    all_dialects().verified_stmt(sql);
+}
+
 #[test]
 fn test_merge_with_insert_qualified_columns() {
    let sql = "\
 MERGE INTO FOO USING FOO_IMPORT ON (FOO.ID = FOO_IMPORT.ID) \
 WHEN NOT MATCHED THEN \
 INSERT (FOO.ID, FOO.NAME) \
-VALUES (1, 2)";
-
-    let expected = "\
-MERGE INTO FOO USING FOO_IMPORT ON (FOO.ID = FOO_IMPORT.ID) \
-WHEN NOT MATCHED THEN \
-INSERT (ID, NAME) \
-VALUES (1, 2)";
-
-    only_generic().one_statement_parses_to(sql, expected);
-}
-
-#[test]
-fn test_merge_with_insert_qualified_columns_via_alias() {
-    let sql = "\
-MERGE INTO FOO F USING FOO_IMPORT ON (F.ID = FOO_IMPORT.ID) \
-WHEN NOT MATCHED THEN \
-INSERT (F.ID, F.NAME) \
-VALUES (1, 2)";
-
-    // note: this serialized form will break execution on an Oracle database
-    // as it doesn't allow the "AS" keyword; Issue #1784
-    let expected = "\
-MERGE INTO FOO AS F USING FOO_IMPORT ON (F.ID = FOO_IMPORT.ID) \
-WHEN NOT MATCHED THEN \
-INSERT (ID, NAME) \
-VALUES (1, 2)";
-
-    only_generic().one_statement_parses_to(sql, expected);
+VALUES (1, 'abc')";
+    pg_and_generic().verified_stmt(sql);
 }

 #[test]
@ -10138,15 +10126,25 @@ fn test_merge_with_insert_qualified_columns_with_schema() {
 MERGE INTO PLAYGROUND.FOO USING FOO_IMPORT ON (PLAYGROUND.FOO.ID = FOO_IMPORT.ID) \
 WHEN NOT MATCHED THEN \
 INSERT (PLAYGROUND.FOO.ID, PLAYGROUND.FOO.NAME) \
-VALUES (1, 2)";
+VALUES (1, 'abc')";
+    pg_and_generic().verified_stmt(sql);
+}

-    let expected = "\
+#[test]
+fn test_merge_insert_with_qualified_columns_not_supported() {
+    let sql = "\
+MERGE INTO FOO USING FOO_IMPORT ON (FOO.ID = FOO_IMPORT.ID) \
+WHEN NOT MATCHED THEN \
+INSERT (FOO.ID, FOO.NAME) \
+VALUES (1, 'abc')";
+    assert!(only_ms().parse_sql_statements(sql).is_err());
+
+    let sql = "\
 MERGE INTO PLAYGROUND.FOO USING FOO_IMPORT ON (PLAYGROUND.FOO.ID = FOO_IMPORT.ID) \
 WHEN NOT MATCHED THEN \
-INSERT (ID, NAME) \
-VALUES (1, 2)";
-
-    only_generic().one_statement_parses_to(sql, expected);
+INSERT (PLAYGROUND.FOO.ID, PLAYGROUND.FOO.NAME) \
+VALUES (1, 'abc')";
+    assert!(only_ms().parse_sql_statements(sql).is_err());
 }

 #[test]