Merge pull request #110 from nickolay/pr/cleanups

Minor code clean-ups
2025-09-26 15:39:12 +00:00 · 2019-06-09 20:24:13 +03:00 · 2019-06-09 20:24:13 +03:00 · 518c8833d2
commit 518c8833d2
parent 2d1e05e21d 99768711dc
3 changed files with 80 additions and 108 deletions
--- a/src/sqlparser.rs
+++ b/src/sqlparser.rs
@ -894,15 +894,10 @@ impl Parser {
            ));
        };
        let if_exists = self.parse_keywords(vec!["IF", "EXISTS"]);
-        let mut names = vec![self.parse_object_name()?];
+        let mut names = vec![];
        loop {
-            let token = &self.next_token();
+            names.push(self.parse_object_name()?);
-            if let Some(Token::Comma) = token {
+            if !self.consume_token(&Token::Comma) {
                names.push(self.parse_object_name()?)
            } else {
                if token.is_some() {
                    self.prev_token();
                }
                break;
            }
        }
@ -1086,10 +1081,9 @@ impl Parser {
            self.expect_token(&Token::Eq)?;
            let value = self.parse_value()?;
            options.push(SQLOption { name, value });
-            match self.peek_token() {
+            if !self.consume_token(&Token::Comma) {
-                Some(Token::Comma) => self.next_token(),
+                break;
-                _ => break,
+            }
            };
        }
        self.expect_token(&Token::RParen)?;
        Ok(options)
@ -1355,30 +1349,14 @@ impl Parser {
    /// Parse one or more identifiers with the specified separator between them
    pub fn parse_list_of_ids(&mut self, separator: &Token) -> Result<Vec<SQLIdent>, ParserError> {
        let mut idents = vec![];
        let mut expect_identifier = true;
        loop {
-            let token = &self.next_token();
+            idents.push(self.parse_identifier()?);
-            match token {
+            if !self.consume_token(separator) {
                Some(Token::SQLWord(s)) if expect_identifier => {
                    expect_identifier = false;
                    idents.push(s.as_sql_ident());
                }
                Some(token) if token == separator && !expect_identifier => {
                    expect_identifier = true;
                    continue;
                }
                _ => {
                    self.prev_token();
                break;
            }
        }
        }
        if expect_identifier {
            self.expected("identifier", self.peek_token())
        } else {
        Ok(idents)
    }
    }
    /// Parse a possibly qualified, possibly quoted identifier, e.g.
    /// `foo` or `myschema."table"`
@ -1920,10 +1898,9 @@ impl Parser {
            self.expect_token(&Token::LParen)?;
            values.push(self.parse_expr_list()?);
            self.expect_token(&Token::RParen)?;
-            match self.peek_token() {
+            if !self.consume_token(&Token::Comma) {
-                Some(Token::Comma) => self.next_token(),
+                break;
-                _ => break,
+            }
            };
        }
        Ok(SQLValues(values))
    }
--- a/src/sqltokenizer.rs
+++ b/src/sqltokenizer.rs
@ -319,29 +319,25 @@ impl<'a> Tokenizer<'a> {
                }
                // delimited (quoted) identifier
                quote_start if self.dialect.is_delimited_identifier_start(quote_start) => {
                    let mut s = String::new();
                    chars.next(); // consume the opening quote
                    let quote_end = SQLWord::matching_end_quote(quote_start);
-                    while let Some(ch) = chars.next() {
+                    let s = peeking_take_while(chars, |ch| ch != quote_end);
-                        match ch {
+                    if chars.next() == Some(quote_end) {
                            c if c == quote_end => break,
                            _ => s.push(ch),
                        }
                    }
                        Ok(Some(Token::make_word(&s, Some(quote_start))))
                    } else {
                        Err(TokenizerError(format!(
                            "Expected close delimiter '{}' before EOF.",
                            quote_end
                        )))
                    }
                }
                // numbers
                '0'..='9' => {
-                    let mut s = String::new();
+                    // TODO: https://jakewheat.github.io/sql-overview/sql-2011-foundation-grammar.html#unsigned-numeric-literal
-                    while let Some(&ch) = chars.peek() {
+                    let s = peeking_take_while(chars, |ch| match ch {
-                        match ch {
+                        '0'..='9' | '.' => true,
-                            '0'..='9' | '.' => {
+                        _ => false,
-                                chars.next(); // consume
+                    });
                                s.push(ch);
                            }
                            _ => break,
                        }
                    }
                    Ok(Some(Token::Number(s)))
                }
                // punctuation
@ -354,22 +350,12 @@ impl<'a> Tokenizer<'a> {
                    match chars.peek() {
                        Some('-') => {
                            chars.next(); // consume the second '-', starting a single-line comment
-                            let mut s = String::new();
+                            let mut s = peeking_take_while(chars, |ch| ch != '\n');
-                            loop {
+                            if let Some(ch) = chars.next() {
-                                match chars.next() {
+                                assert_eq!(ch, '\n');
                                    Some(ch) if ch != '\n' => {
                                s.push(ch);
                            }
-                                    other => {
+                            Ok(Some(Token::Whitespace(Whitespace::SingleLineComment(s))))
                                        if other.is_some() {
                                            s.push('\n');
                                        }
                                        break Ok(Some(Token::Whitespace(
                                            Whitespace::SingleLineComment(s),
                                        )));
                                    }
                                }
                            }
                        }
                        // a regular '-' operator
                        _ => Ok(Some(Token::Minus)),
@ -394,55 +380,37 @@ impl<'a> Tokenizer<'a> {
                '!' => {
                    chars.next(); // consume
                    match chars.peek() {
-                        Some(&ch) => match ch {
+                        Some('=') => self.consume_and_return(chars, Token::Neq),
                            '=' => self.consume_and_return(chars, Token::Neq),
                        _ => Err(TokenizerError(format!(
                            "Tokenizer Error at Line: {}, Col: {}",
                            self.line, self.col
                        ))),
                        },
                        None => Err(TokenizerError(format!(
                            "Tokenizer Error at Line: {}, Col: {}",
                            self.line, self.col
                        ))),
                    }
                }
                '<' => {
                    chars.next(); // consume
                    match chars.peek() {
-                        Some(&ch) => match ch {
+                        Some('=') => self.consume_and_return(chars, Token::LtEq),
-                            '=' => self.consume_and_return(chars, Token::LtEq),
+                        Some('>') => self.consume_and_return(chars, Token::Neq),
                            '>' => self.consume_and_return(chars, Token::Neq),
                        _ => Ok(Some(Token::Lt)),
                        },
                        None => Ok(Some(Token::Lt)),
                    }
                }
                '>' => {
                    chars.next(); // consume
                    match chars.peek() {
-                        Some(&ch) => match ch {
+                        Some('=') => self.consume_and_return(chars, Token::GtEq),
                            '=' => self.consume_and_return(chars, Token::GtEq),
                        _ => Ok(Some(Token::Gt)),
                        },
                        None => Ok(Some(Token::Gt)),
                    }
                }
                // colon
                ':' => {
                    chars.next();
                    match chars.peek() {
-                        Some(&ch) => match ch {
+                        Some(':') => self.consume_and_return(chars, Token::DoubleColon),
                            // double colon
                            ':' => self.consume_and_return(chars, Token::DoubleColon),
                        _ => Ok(Some(Token::Colon)),
                        },
                        None => Ok(Some(Token::Colon)),
                    }
                }
                ';' => self.consume_and_return(chars, Token::SemiColon),
                '\\' => self.consume_and_return(chars, Token::Backslash),
                // brakets
                '[' => self.consume_and_return(chars, Token::LBracket),
                ']' => self.consume_and_return(chars, Token::RBracket),
                '&' => self.consume_and_return(chars, Token::Ampersand),
@ -456,16 +424,10 @@ impl<'a> Tokenizer<'a> {
    /// Tokenize an identifier or keyword, after the first char is already consumed.
    fn tokenize_word(&self, first_char: char, chars: &mut Peekable<Chars<'_>>) -> String {
-        let mut s = String::new();
+        let mut s = first_char.to_string();
-        s.push(first_char);
+        s.push_str(&peeking_take_while(chars, |ch| {
-        while let Some(&ch) = chars.peek() {
+            self.dialect.is_identifier_part(ch)
-            if self.dialect.is_identifier_part(ch) {
+        }));
                chars.next(); // consume
                s.push(ch);
            } else {
                break;
            }
        }
        s
    }
@ -539,6 +501,25 @@ impl<'a> Tokenizer<'a> {
    }
 }
 /// Read from `chars` until `predicate` returns `false` or EOF is hit.
 /// Return the characters read as String, and keep the first non-matching
 /// char available as `chars.next()`.
 fn peeking_take_while(
    chars: &mut Peekable<Chars<'_>>,
    mut predicate: impl FnMut(char) -> bool,
 ) -> String {
    let mut s = String::new();
    while let Some(&ch) = chars.peek() {
        if predicate(ch) {
            chars.next(); // consume
            s.push(ch);
        } else {
            break;
        }
    }
    s
 }
 #[cfg(test)]
 mod tests {
    use super::super::dialect::GenericSqlDialect;
@ -768,6 +749,20 @@ mod tests {
        compare(expected, tokens);
    }
    #[test]
    fn tokenize_mismatched_quotes() {
        let sql = String::from("\"foo");
        let dialect = GenericSqlDialect {};
        let mut tokenizer = Tokenizer::new(&dialect, &sql);
        assert_eq!(
            tokenizer.tokenize(),
            Err(TokenizerError(
                "Expected close delimiter '\"' before EOF.".to_string(),
            ))
        );
    }
    #[test]
    fn tokenize_newlines() {
        let sql = String::from("line1\nline2\rline3\r\nline4\r");
--- a/tests/sqlparser_common.rs
+++ b/tests/sqlparser_common.rs
@ -1994,7 +1994,7 @@ fn parse_drop_table() {
            assert_eq!(SQLObjectType::Table, object_type);
            assert_eq!(
                vec!["foo"],
-                names.iter().map(|n| n.to_string()).collect::<Vec<_>>()
+                names.iter().map(ToString::to_string).collect::<Vec<_>>()
            );
            assert_eq!(false, cascade);
        }
@ -2013,7 +2013,7 @@ fn parse_drop_table() {
            assert_eq!(SQLObjectType::Table, object_type);
            assert_eq!(
                vec!["foo", "bar"],
-                names.iter().map(|n| n.to_string()).collect::<Vec<_>>()
+                names.iter().map(ToString::to_string).collect::<Vec<_>>()
            );
            assert_eq!(true, cascade);
        }
@ -2042,7 +2042,7 @@ fn parse_drop_view() {
        } => {
            assert_eq!(
                vec!["myschema.myview"],
-                names.iter().map(|n| n.to_string()).collect::<Vec<_>>()
+                names.iter().map(ToString::to_string).collect::<Vec<_>>()
            );
            assert_eq!(SQLObjectType::View, object_type);
        }