lib/Rewrite/TokenRewriter.cpp

*67e74705SXin Li//===--- TokenRewriter.cpp - Token-based code rewriting interface ---------===//
*67e74705SXin Li//
*67e74705SXin Li//                     The LLVM Compiler Infrastructure
*67e74705SXin Li//
*67e74705SXin Li// This file is distributed under the University of Illinois Open Source
*67e74705SXin Li// License. See LICENSE.TXT for details.
*67e74705SXin Li//
*67e74705SXin Li//===----------------------------------------------------------------------===//
*67e74705SXin Li//
*67e74705SXin Li//  This file implements the TokenRewriter class, which is used for code
*67e74705SXin Li//  transformations.
*67e74705SXin Li//
*67e74705SXin Li//===----------------------------------------------------------------------===//
*67e74705SXin Li
*67e74705SXin Li#include "clang/Rewrite/Core/TokenRewriter.h"
*67e74705SXin Li#include "clang/Basic/SourceManager.h"
*67e74705SXin Li#include "clang/Lex/Lexer.h"
*67e74705SXin Li#include "clang/Lex/ScratchBuffer.h"
*67e74705SXin Liusing namespace clang;
*67e74705SXin Li
*67e74705SXin LiTokenRewriter::TokenRewriter(FileID FID, SourceManager &SM,
*67e74705SXin Li                             const LangOptions &LangOpts) {
*67e74705SXin Li  ScratchBuf.reset(new ScratchBuffer(SM));
*67e74705SXin Li
*67e74705SXin Li  // Create a lexer to lex all the tokens of the main file in raw mode.
*67e74705SXin Li  const llvm::MemoryBuffer *FromFile = SM.getBuffer(FID);
*67e74705SXin Li  Lexer RawLex(FID, FromFile, SM, LangOpts);
*67e74705SXin Li
*67e74705SXin Li  // Return all comments and whitespace as tokens.
*67e74705SXin Li  RawLex.SetKeepWhitespaceMode(true);
*67e74705SXin Li
*67e74705SXin Li  // Lex the file, populating our datastructures.
*67e74705SXin Li  Token RawTok;
*67e74705SXin Li  RawLex.LexFromRawLexer(RawTok);
*67e74705SXin Li  while (RawTok.isNot(tok::eof)) {
*67e74705SXin Li#if 0
*67e74705SXin Li    if (Tok.is(tok::raw_identifier)) {
*67e74705SXin Li      // Look up the identifier info for the token.  This should use
*67e74705SXin Li      // IdentifierTable directly instead of PP.
*67e74705SXin Li      PP.LookUpIdentifierInfo(Tok);
*67e74705SXin Li    }
*67e74705SXin Li#endif
*67e74705SXin Li
*67e74705SXin Li    AddToken(RawTok, TokenList.end());
*67e74705SXin Li    RawLex.LexFromRawLexer(RawTok);
*67e74705SXin Li  }
*67e74705SXin Li}
*67e74705SXin Li
*67e74705SXin LiTokenRewriter::~TokenRewriter() {
*67e74705SXin Li}
*67e74705SXin Li
*67e74705SXin Li
*67e74705SXin Li/// RemapIterator - Convert from token_iterator (a const iterator) to
*67e74705SXin Li/// TokenRefTy (a non-const iterator).
*67e74705SXin LiTokenRewriter::TokenRefTy TokenRewriter::RemapIterator(token_iterator I) {
*67e74705SXin Li  if (I == token_end()) return TokenList.end();
*67e74705SXin Li
*67e74705SXin Li  // FIXME: This is horrible, we should use our own list or something to avoid
*67e74705SXin Li  // this.
*67e74705SXin Li  std::map<SourceLocation, TokenRefTy>::iterator MapIt =
*67e74705SXin Li    TokenAtLoc.find(I->getLocation());
*67e74705SXin Li  assert(MapIt != TokenAtLoc.end() && "iterator not in rewriter?");
*67e74705SXin Li  return MapIt->second;
*67e74705SXin Li}
*67e74705SXin Li
*67e74705SXin Li
*67e74705SXin Li/// AddToken - Add the specified token into the Rewriter before the other
*67e74705SXin Li/// position.
*67e74705SXin LiTokenRewriter::TokenRefTy
*67e74705SXin LiTokenRewriter::AddToken(const Token &T, TokenRefTy Where) {
*67e74705SXin Li  Where = TokenList.insert(Where, T);
*67e74705SXin Li
*67e74705SXin Li  bool InsertSuccess = TokenAtLoc.insert(std::make_pair(T.getLocation(),
*67e74705SXin Li                                                        Where)).second;
*67e74705SXin Li  assert(InsertSuccess && "Token location already in rewriter!");
*67e74705SXin Li  (void)InsertSuccess;
*67e74705SXin Li  return Where;
*67e74705SXin Li}
*67e74705SXin Li
*67e74705SXin Li
*67e74705SXin LiTokenRewriter::token_iterator
*67e74705SXin LiTokenRewriter::AddTokenBefore(token_iterator I, const char *Val) {
*67e74705SXin Li  unsigned Len = strlen(Val);
*67e74705SXin Li
*67e74705SXin Li  // Plop the string into the scratch buffer, then create a token for this
*67e74705SXin Li  // string.
*67e74705SXin Li  Token Tok;
*67e74705SXin Li  Tok.startToken();
*67e74705SXin Li  const char *Spelling;
*67e74705SXin Li  Tok.setLocation(ScratchBuf->getToken(Val, Len, Spelling));
*67e74705SXin Li  Tok.setLength(Len);
*67e74705SXin Li
*67e74705SXin Li  // TODO: Form a whole lexer around this and relex the token!  For now, just
*67e74705SXin Li  // set kind to tok::unknown.
*67e74705SXin Li  Tok.setKind(tok::unknown);
*67e74705SXin Li
*67e74705SXin Li  return AddToken(Tok, RemapIterator(I));
*67e74705SXin Li}
*67e74705SXin Li