autotest_lib/tko/parse.py

*9c5db199SXin Li#!/usr/bin/python3 -u
*9c5db199SXin Li
*9c5db199SXin Lifrom __future__ import absolute_import
*9c5db199SXin Lifrom __future__ import division
*9c5db199SXin Lifrom __future__ import print_function
*9c5db199SXin Li
*9c5db199SXin Liimport collections
*9c5db199SXin Liimport errno
*9c5db199SXin Liimport fcntl
*9c5db199SXin Liimport json
*9c5db199SXin Liimport optparse
*9c5db199SXin Liimport os
*9c5db199SXin Liimport socket
*9c5db199SXin Liimport sys
*9c5db199SXin Liimport time
*9c5db199SXin Liimport traceback
*9c5db199SXin Li
*9c5db199SXin Liimport common
*9c5db199SXin Lifrom autotest_lib.client.bin.result_tools import utils as result_utils
*9c5db199SXin Lifrom autotest_lib.client.bin.result_tools import utils_lib as result_utils_lib
*9c5db199SXin Lifrom autotest_lib.client.bin.result_tools import runner as result_runner
*9c5db199SXin Lifrom autotest_lib.client.common_lib import control_data
*9c5db199SXin Lifrom autotest_lib.client.common_lib import global_config
*9c5db199SXin Lifrom autotest_lib.client.common_lib import mail, pidfile
*9c5db199SXin Lifrom autotest_lib.client.common_lib import utils
*9c5db199SXin Lifrom autotest_lib.frontend import setup_django_environment
*9c5db199SXin Lifrom autotest_lib.frontend.tko import models as tko_models
*9c5db199SXin Lifrom autotest_lib.server import site_utils
*9c5db199SXin Lifrom autotest_lib.server.cros.dynamic_suite import constants
*9c5db199SXin Lifrom autotest_lib.tko import db as tko_db, utils as tko_utils
*9c5db199SXin Lifrom autotest_lib.tko import models, parser_lib
*9c5db199SXin Lifrom autotest_lib.tko.perf_upload import perf_uploader
*9c5db199SXin Lifrom autotest_lib.utils.side_effects import config_loader
*9c5db199SXin Liimport six
*9c5db199SXin Li
*9c5db199SXin Litry:
*9c5db199SXin Li    from autotest_lib.utils.frozen_chromite.lib import metrics
*9c5db199SXin Liexcept ImportError:
*9c5db199SXin Li    metrics = utils.metrics_mock
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Li_ParseOptions = collections.namedtuple(
*9c5db199SXin Li    'ParseOptions', ['reparse', 'mail_on_failure', 'dry_run', 'suite_report',
*9c5db199SXin Li                     'datastore_creds', 'export_to_gcloud_path',
*9c5db199SXin Li                     'disable_perf_upload'])
*9c5db199SXin Li
*9c5db199SXin Li_HARDCODED_CONTROL_FILE_NAMES = (
*9c5db199SXin Li        # client side test control, as saved in old Autotest paths.
*9c5db199SXin Li        'control',
*9c5db199SXin Li        # server side test control, as saved in old Autotest paths.
*9c5db199SXin Li        'control.srv',
*9c5db199SXin Li        # All control files, as saved in skylab.
*9c5db199SXin Li        'control.from_control_name',
*9c5db199SXin Li)
*9c5db199SXin Li
*9c5db199SXin Li# Max size for the parser is 350mb due to large suites getting throttled.
*9c5db199SXin LiDEFAULT_MAX_RESULT_SIZE_KB = 350000
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef parse_args():
*9c5db199SXin Li    """Parse args."""
*9c5db199SXin Li    # build up our options parser and parse sys.argv
*9c5db199SXin Li    parser = optparse.OptionParser()
*9c5db199SXin Li    parser.add_option("-m", help="Send mail for FAILED tests",
*9c5db199SXin Li                      dest="mailit", action="store_true")
*9c5db199SXin Li    parser.add_option("-r", help="Reparse the results of a job",
*9c5db199SXin Li                      dest="reparse", action="store_true")
*9c5db199SXin Li    parser.add_option("-o", help="Parse a single results directory",
*9c5db199SXin Li                      dest="singledir", action="store_true")
*9c5db199SXin Li    parser.add_option("-l", help=("Levels of subdirectories to include "
*9c5db199SXin Li                                  "in the job name"),
*9c5db199SXin Li                      type="int", dest="level", default=1)
*9c5db199SXin Li    parser.add_option("-n", help="No blocking on an existing parse",
*9c5db199SXin Li                      dest="noblock", action="store_true")
*9c5db199SXin Li    parser.add_option("-s", help="Database server hostname",
*9c5db199SXin Li                      dest="db_host", action="store")
*9c5db199SXin Li    parser.add_option("-u", help="Database username", dest="db_user",
*9c5db199SXin Li                      action="store")
*9c5db199SXin Li    parser.add_option("-p", help="Database password", dest="db_pass",
*9c5db199SXin Li                      action="store")
*9c5db199SXin Li    parser.add_option("-d", help="Database name", dest="db_name",
*9c5db199SXin Li                      action="store")
*9c5db199SXin Li    parser.add_option("--dry-run", help="Do not actually commit any results.",
*9c5db199SXin Li                      dest="dry_run", action="store_true", default=False)
*9c5db199SXin Li    parser.add_option(
*9c5db199SXin Li            "--detach", action="store_true",
*9c5db199SXin Li            help="Detach parsing process from the caller process. Used by "
*9c5db199SXin Li                 "monitor_db to safely restart without affecting parsing.",
*9c5db199SXin Li            default=False)
*9c5db199SXin Li    parser.add_option("--write-pidfile",
*9c5db199SXin Li                      help="write pidfile (.parser_execute)",
*9c5db199SXin Li                      dest="write_pidfile", action="store_true",
*9c5db199SXin Li                      default=False)
*9c5db199SXin Li    parser.add_option("--record-duration",
*9c5db199SXin Li                      help="[DEPRECATED] Record timing to metadata db",
*9c5db199SXin Li                      dest="record_duration", action="store_true",
*9c5db199SXin Li                      default=False)
*9c5db199SXin Li    parser.add_option("--suite-report",
*9c5db199SXin Li                      help=("Allows parsing job to attempt to create a suite "
*9c5db199SXin Li                            "timeline report, if it detects that the job being "
*9c5db199SXin Li                            "parsed is a suite job."),
*9c5db199SXin Li                      dest="suite_report", action="store_true",
*9c5db199SXin Li                      default=False)
*9c5db199SXin Li    parser.add_option("--datastore-creds",
*9c5db199SXin Li                      help=("[DEPRECATED] "
*9c5db199SXin Li                            "The path to gcloud datastore credentials file, "
*9c5db199SXin Li                            "which will be used to upload suite timeline "
*9c5db199SXin Li                            "report to gcloud."),
*9c5db199SXin Li                      dest="datastore_creds",
*9c5db199SXin Li                      action="store",
*9c5db199SXin Li                      default=None)
*9c5db199SXin Li    parser.add_option(
*9c5db199SXin Li            "--export-to-gcloud-path",
*9c5db199SXin Li            help=("[DEPRECATED] "
*9c5db199SXin Li                  "The path to export_to_gcloud script. Please find "
*9c5db199SXin Li                  "chromite path on your server. The script is under "
*9c5db199SXin Li                  "chromite/bin/."),
*9c5db199SXin Li            dest="export_to_gcloud_path",
*9c5db199SXin Li            action="store",
*9c5db199SXin Li            default=None)
*9c5db199SXin Li    parser.add_option("--disable-perf-upload",
*9c5db199SXin Li                      help=("Do not upload perf results to chrome perf."),
*9c5db199SXin Li                      dest="disable_perf_upload", action="store_true",
*9c5db199SXin Li                      default=False)
*9c5db199SXin Li    options, args = parser.parse_args()
*9c5db199SXin Li
*9c5db199SXin Li    # we need a results directory
*9c5db199SXin Li    if len(args) == 0:
*9c5db199SXin Li        tko_utils.dprint("ERROR: at least one results directory must "
*9c5db199SXin Li                         "be provided")
*9c5db199SXin Li        parser.print_help()
*9c5db199SXin Li        sys.exit(1)
*9c5db199SXin Li
*9c5db199SXin Li    # pass the options back
*9c5db199SXin Li    return options, args
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef format_failure_message(jobname, kernel, testname, status, reason):
*9c5db199SXin Li    """Format failure message with the given information.
*9c5db199SXin Li
*9c5db199SXin Li    @param jobname: String representing the job name.
*9c5db199SXin Li    @param kernel: String representing the kernel.
*9c5db199SXin Li    @param testname: String representing the test name.
*9c5db199SXin Li    @param status: String representing the test status.
*9c5db199SXin Li    @param reason: String representing the reason.
*9c5db199SXin Li
*9c5db199SXin Li    @return: Failure message as a string.
*9c5db199SXin Li    """
*9c5db199SXin Li    format_string = "%-12s %-20s %-12s %-10s %s"
*9c5db199SXin Li    return format_string % (jobname, kernel, testname, status, reason)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef mailfailure(jobname, job, message):
*9c5db199SXin Li    """Send an email about the failure.
*9c5db199SXin Li
*9c5db199SXin Li    @param jobname: String representing the job name.
*9c5db199SXin Li    @param job: A job object.
*9c5db199SXin Li    @param message: The message to mail.
*9c5db199SXin Li    """
*9c5db199SXin Li    message_lines = [""]
*9c5db199SXin Li    message_lines.append("The following tests FAILED for this job")
*9c5db199SXin Li    message_lines.append("http://%s/results/%s" %
*9c5db199SXin Li                         (socket.gethostname(), jobname))
*9c5db199SXin Li    message_lines.append("")
*9c5db199SXin Li    message_lines.append(format_failure_message("Job name", "Kernel",
*9c5db199SXin Li                                                "Test name", "FAIL/WARN",
*9c5db199SXin Li                                                "Failure reason"))
*9c5db199SXin Li    message_lines.append(format_failure_message("=" * 8, "=" * 6, "=" * 8,
*9c5db199SXin Li                                                "=" * 8, "=" * 14))
*9c5db199SXin Li    message_header = "\n".join(message_lines)
*9c5db199SXin Li
*9c5db199SXin Li    subject = "AUTOTEST: FAILED tests from job %s" % jobname
*9c5db199SXin Li    mail.send("", job.user, "", subject, message_header + message)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _invalidate_original_tests(orig_job_idx, retry_job_idx):
*9c5db199SXin Li    """Retry tests invalidates original tests.
*9c5db199SXin Li
*9c5db199SXin Li    Whenever a retry job is complete, we want to invalidate the original
*9c5db199SXin Li    job's test results, such that the consumers of the tko database
*9c5db199SXin Li    (e.g. tko frontend, wmatrix) could figure out which results are the latest.
*9c5db199SXin Li
*9c5db199SXin Li    When a retry job is parsed, we retrieve the original job's afe_job_id
*9c5db199SXin Li    from the retry job's keyvals, which is then converted to tko job_idx and
*9c5db199SXin Li    passed into this method as |orig_job_idx|.
*9c5db199SXin Li
*9c5db199SXin Li    In this method, we are going to invalidate the rows in tko_tests that are
*9c5db199SXin Li    associated with the original job by flipping their 'invalid' bit to True.
*9c5db199SXin Li    In addition, in tko_tests, we also maintain a pointer from the retry results
*9c5db199SXin Li    to the original results, so that later we can always know which rows in
*9c5db199SXin Li    tko_tests are retries and which are the corresponding original results.
*9c5db199SXin Li    This is done by setting the field 'invalidates_test_idx' of the tests
*9c5db199SXin Li    associated with the retry job.
*9c5db199SXin Li
*9c5db199SXin Li    For example, assume Job(job_idx=105) are retried by Job(job_idx=108), after
*9c5db199SXin Li    this method is run, their tko_tests rows will look like:
*9c5db199SXin Li    __________________________________________________________________________
*9c5db199SXin Li    test_idx| job_idx | test              | ... | invalid | invalidates_test_idx
*9c5db199SXin Li    10      | 105     | example_Fail.Error| ... | 1       | NULL
*9c5db199SXin Li    11      | 105     | example_Fail.Fail | ... | 1       | NULL
*9c5db199SXin Li    ...
*9c5db199SXin Li    20      | 108     | example_Fail.Error| ... | 0       | 10
*9c5db199SXin Li    21      | 108     | example_Fail.Fail | ... | 0       | 11
*9c5db199SXin Li    __________________________________________________________________________
*9c5db199SXin Li    Note the invalid bits of the rows for Job(job_idx=105) are set to '1'.
*9c5db199SXin Li    And the 'invalidates_test_idx' fields of the rows for Job(job_idx=108)
*9c5db199SXin Li    are set to 10 and 11 (the test_idx of the rows for the original job).
*9c5db199SXin Li
*9c5db199SXin Li    @param orig_job_idx: An integer representing the original job's
*9c5db199SXin Li                         tko job_idx. Tests associated with this job will
*9c5db199SXin Li                         be marked as 'invalid'.
*9c5db199SXin Li    @param retry_job_idx: An integer representing the retry job's
*9c5db199SXin Li                          tko job_idx. The field 'invalidates_test_idx'
*9c5db199SXin Li                          of the tests associated with this job will be updated.
*9c5db199SXin Li
*9c5db199SXin Li    """
*9c5db199SXin Li    msg = 'orig_job_idx: %s, retry_job_idx: %s' % (orig_job_idx, retry_job_idx)
*9c5db199SXin Li    if not orig_job_idx or not retry_job_idx:
*9c5db199SXin Li        tko_utils.dprint('ERROR: Could not invalidate tests: ' + msg)
*9c5db199SXin Li    # Using django models here makes things easier, but make sure that
*9c5db199SXin Li    # before this method is called, all other relevant transactions have been
*9c5db199SXin Li    # committed to avoid race condition. In the long run, we might consider
*9c5db199SXin Li    # to make the rest of parser use django models.
*9c5db199SXin Li    orig_tests = tko_models.Test.objects.filter(job__job_idx=orig_job_idx)
*9c5db199SXin Li    retry_tests = tko_models.Test.objects.filter(job__job_idx=retry_job_idx)
*9c5db199SXin Li
*9c5db199SXin Li    # Invalidate original tests.
*9c5db199SXin Li    orig_tests.update(invalid=True)
*9c5db199SXin Li
*9c5db199SXin Li    # Maintain a dictionary that maps (test, subdir) to original tests.
*9c5db199SXin Li    # Note that within the scope of a job, (test, subdir) uniquelly
*9c5db199SXin Li    # identifies a test run, but 'test' does not.
*9c5db199SXin Li    # In a control file, one could run the same test with different
*9c5db199SXin Li    # 'subdir_tag', for example,
*9c5db199SXin Li    #     job.run_test('example_Fail', tag='Error', subdir_tag='subdir_1')
*9c5db199SXin Li    #     job.run_test('example_Fail', tag='Error', subdir_tag='subdir_2')
*9c5db199SXin Li    # In tko, we will get
*9c5db199SXin Li    #    (test='example_Fail.Error', subdir='example_Fail.Error.subdir_1')
*9c5db199SXin Li    #    (test='example_Fail.Error', subdir='example_Fail.Error.subdir_2')
*9c5db199SXin Li    invalidated_tests = {(orig_test.test, orig_test.subdir): orig_test
*9c5db199SXin Li                         for orig_test in orig_tests}
*9c5db199SXin Li    for retry in retry_tests:
*9c5db199SXin Li        # It is possible that (retry.test, retry.subdir) doesn't exist
*9c5db199SXin Li        # in invalidated_tests. This could happen when the original job
*9c5db199SXin Li        # didn't run some of its tests. For example, a dut goes offline
*9c5db199SXin Li        # since the beginning of the job, in which case invalidated_tests
*9c5db199SXin Li        # will only have one entry for 'SERVER_JOB'.
*9c5db199SXin Li        orig_test = invalidated_tests.get((retry.test, retry.subdir), None)
*9c5db199SXin Li        if orig_test:
*9c5db199SXin Li            retry.invalidates_test = orig_test
*9c5db199SXin Li            retry.save()
*9c5db199SXin Li    tko_utils.dprint('DEBUG: Invalidated tests associated to job: ' + msg)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _throttle_result_size(path):
*9c5db199SXin Li    """Limit the total size of test results for the given path.
*9c5db199SXin Li
*9c5db199SXin Li    @param path: Path of the result directory.
*9c5db199SXin Li    """
*9c5db199SXin Li    if not result_runner.ENABLE_RESULT_THROTTLING:
*9c5db199SXin Li        tko_utils.dprint(
*9c5db199SXin Li                'Result throttling is not enabled. Skipping throttling %s' %
*9c5db199SXin Li                path)
*9c5db199SXin Li        return
*9c5db199SXin Li
*9c5db199SXin Li    max_result_size_KB = _max_result_size_from_control(path)
*9c5db199SXin Li    if max_result_size_KB is None:
*9c5db199SXin Li        max_result_size_KB = DEFAULT_MAX_RESULT_SIZE_KB
*9c5db199SXin Li
*9c5db199SXin Li    try:
*9c5db199SXin Li        result_utils.execute(path, max_result_size_KB)
*9c5db199SXin Li    except:
*9c5db199SXin Li        tko_utils.dprint(
*9c5db199SXin Li                'Failed to throttle result size of %s.\nDetails %s' %
*9c5db199SXin Li                (path, traceback.format_exc()))
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _max_result_size_from_control(path):
*9c5db199SXin Li    """Gets the max result size set in a control file, if any.
*9c5db199SXin Li
*9c5db199SXin Li    If not overrides is found, returns None.
*9c5db199SXin Li    """
*9c5db199SXin Li    for control_file in _HARDCODED_CONTROL_FILE_NAMES:
*9c5db199SXin Li        control = os.path.join(path, control_file)
*9c5db199SXin Li        if not os.path.exists(control):
*9c5db199SXin Li            continue
*9c5db199SXin Li
*9c5db199SXin Li        try:
*9c5db199SXin Li            max_result_size_KB = control_data.parse_control(
*9c5db199SXin Li                    control, raise_warnings=False).max_result_size_KB
*9c5db199SXin Li            if max_result_size_KB != DEFAULT_MAX_RESULT_SIZE_KB:
*9c5db199SXin Li                return max_result_size_KB
*9c5db199SXin Li        except IOError as e:
*9c5db199SXin Li            tko_utils.dprint(
*9c5db199SXin Li                    'Failed to access %s. Error: %s\nDetails %s' %
*9c5db199SXin Li                    (control, e, traceback.format_exc()))
*9c5db199SXin Li        except control_data.ControlVariableException as e:
*9c5db199SXin Li            tko_utils.dprint(
*9c5db199SXin Li                    'Failed to parse %s. Error: %s\nDetails %s' %
*9c5db199SXin Li                    (control, e, traceback.format_exc()))
*9c5db199SXin Li    return None
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef export_tko_job_to_file(job, jobname, filename):
*9c5db199SXin Li    """Exports the tko job to disk file.
*9c5db199SXin Li
*9c5db199SXin Li    @param job: database object.
*9c5db199SXin Li    @param jobname: the job name as string.
*9c5db199SXin Li    @param filename: the serialized binary destination path.
*9c5db199SXin Li    """
*9c5db199SXin Li    from autotest_lib.tko import job_serializer
*9c5db199SXin Li
*9c5db199SXin Li    serializer = job_serializer.JobSerializer()
*9c5db199SXin Li    serializer.serialize_to_binary(job, jobname, filename)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef parse_one(db, pid_file_manager, jobname, path, parse_options):
*9c5db199SXin Li    """Parse a single job. Optionally send email on failure.
*9c5db199SXin Li
*9c5db199SXin Li    @param db: database object.
*9c5db199SXin Li    @param pid_file_manager: pidfile.PidFileManager object.
*9c5db199SXin Li    @param jobname: the tag used to search for existing job in db,
*9c5db199SXin Li                    e.g. '1234-chromeos-test/host1'
*9c5db199SXin Li    @param path: The path to the results to be parsed.
*9c5db199SXin Li    @param parse_options: _ParseOptions instance.
*9c5db199SXin Li
*9c5db199SXin Li    @return job: the parsed job object
*9c5db199SXin Li    """
*9c5db199SXin Li    reparse = parse_options.reparse
*9c5db199SXin Li    mail_on_failure = parse_options.mail_on_failure
*9c5db199SXin Li    dry_run = parse_options.dry_run
*9c5db199SXin Li    suite_report = parse_options.suite_report
*9c5db199SXin Li
*9c5db199SXin Li    tko_utils.dprint("\nScanning %s (%s)" % (jobname, path))
*9c5db199SXin Li    old_job_idx = db.find_job(jobname)
*9c5db199SXin Li    if old_job_idx is not None and not reparse:
*9c5db199SXin Li        tko_utils.dprint("! Job is already parsed, done")
*9c5db199SXin Li        return None
*9c5db199SXin Li
*9c5db199SXin Li    # look up the status version
*9c5db199SXin Li    job_keyval = models.job.read_keyval(path)
*9c5db199SXin Li    status_version = job_keyval.get("status_version", 0)
*9c5db199SXin Li
*9c5db199SXin Li    parser = parser_lib.parser(status_version)
*9c5db199SXin Li    job = parser.make_job(path)
*9c5db199SXin Li    tko_utils.dprint("+ Parsing dir=%s, jobname=%s" % (path, jobname))
*9c5db199SXin Li    status_log_path = _find_status_log_path(path)
*9c5db199SXin Li    if not status_log_path:
*9c5db199SXin Li        tko_utils.dprint("! Unable to parse job, no status file")
*9c5db199SXin Li        return None
*9c5db199SXin Li    _parse_status_log(parser, job, status_log_path)
*9c5db199SXin Li
*9c5db199SXin Li    if old_job_idx is not None:
*9c5db199SXin Li        job.job_idx = old_job_idx
*9c5db199SXin Li        unmatched_tests = _match_existing_tests(db, job)
*9c5db199SXin Li        if not dry_run:
*9c5db199SXin Li            _delete_tests_from_db(db, unmatched_tests)
*9c5db199SXin Li
*9c5db199SXin Li    job.afe_job_id = tko_utils.get_afe_job_id(jobname)
*9c5db199SXin Li    job.skylab_task_id = tko_utils.get_skylab_task_id(jobname)
*9c5db199SXin Li    job.afe_parent_job_id = job_keyval.get(constants.PARENT_JOB_ID)
*9c5db199SXin Li    job.skylab_parent_task_id = job_keyval.get(constants.PARENT_JOB_ID)
*9c5db199SXin Li    job.build = None
*9c5db199SXin Li    job.board = None
*9c5db199SXin Li    job.build_version = None
*9c5db199SXin Li    job.suite = None
*9c5db199SXin Li    if job.label:
*9c5db199SXin Li        label_info = site_utils.parse_job_name(job.label)
*9c5db199SXin Li        if label_info:
*9c5db199SXin Li            job.build = label_info.get('build', None)
*9c5db199SXin Li            job.build_version = label_info.get('build_version', None)
*9c5db199SXin Li            job.board = label_info.get('board', None)
*9c5db199SXin Li            job.suite = label_info.get('suite', None)
*9c5db199SXin Li
*9c5db199SXin Li    if 'suite' in job.keyval_dict:
*9c5db199SXin Li        job.suite = job.keyval_dict['suite']
*9c5db199SXin Li
*9c5db199SXin Li    result_utils_lib.LOG =  tko_utils.dprint
*9c5db199SXin Li
*9c5db199SXin Li    # Do not throttle results for now (b/207409280)
*9c5db199SXin Li    # _throttle_result_size(path)
*9c5db199SXin Li
*9c5db199SXin Li    # Record test result size to job_keyvals
*9c5db199SXin Li    start_time = time.time()
*9c5db199SXin Li    result_size_info = site_utils.collect_result_sizes(
*9c5db199SXin Li            path, log=tko_utils.dprint)
*9c5db199SXin Li    tko_utils.dprint('Finished collecting result sizes after %s seconds' %
*9c5db199SXin Li                     (time.time()-start_time))
*9c5db199SXin Li    job.keyval_dict.update(result_size_info._asdict())
*9c5db199SXin Li
*9c5db199SXin Li    # TODO(dshi): Update sizes with sponge_invocation.xml and throttle it.
*9c5db199SXin Li
*9c5db199SXin Li    # check for failures
*9c5db199SXin Li    message_lines = [""]
*9c5db199SXin Li    job_successful = True
*9c5db199SXin Li    for test in job.tests:
*9c5db199SXin Li        if not test.subdir:
*9c5db199SXin Li            continue
*9c5db199SXin Li        tko_utils.dprint("* testname, subdir, status, reason: %s %s %s %s"
*9c5db199SXin Li                         % (test.testname, test.subdir, test.status,
*9c5db199SXin Li                            test.reason))
*9c5db199SXin Li        if test.status not in ('GOOD', 'WARN'):
*9c5db199SXin Li            job_successful = False
*9c5db199SXin Li            pid_file_manager.num_tests_failed += 1
*9c5db199SXin Li            message_lines.append(format_failure_message(
*9c5db199SXin Li                jobname, test.kernel.base, test.subdir,
*9c5db199SXin Li                test.status, test.reason))
*9c5db199SXin Li
*9c5db199SXin Li    message = "\n".join(message_lines)
*9c5db199SXin Li
*9c5db199SXin Li    if not dry_run:
*9c5db199SXin Li        # send out a email report of failure
*9c5db199SXin Li        if len(message) > 2 and mail_on_failure:
*9c5db199SXin Li            tko_utils.dprint("Sending email report of failure on %s to %s"
*9c5db199SXin Li                                % (jobname, job.user))
*9c5db199SXin Li            mailfailure(jobname, job, message)
*9c5db199SXin Li
*9c5db199SXin Li        # Upload perf values to the perf dashboard, if applicable.
*9c5db199SXin Li        if parse_options.disable_perf_upload:
*9c5db199SXin Li            tko_utils.dprint("Skipping results upload to chrome perf as it is "
*9c5db199SXin Li                "disabled by config")
*9c5db199SXin Li        else:
*9c5db199SXin Li            for test in job.tests:
*9c5db199SXin Li                perf_uploader.upload_test(job, test, jobname)
*9c5db199SXin Li
*9c5db199SXin Li        _write_job_to_db(db, jobname, job)
*9c5db199SXin Li
*9c5db199SXin Li        # Verify the job data is written to the database.
*9c5db199SXin Li        if job.tests:
*9c5db199SXin Li            tests_in_db = db.find_tests(job.job_idx)
*9c5db199SXin Li            tests_in_db_count = len(tests_in_db) if tests_in_db else 0
*9c5db199SXin Li            if tests_in_db_count != len(job.tests):
*9c5db199SXin Li                tko_utils.dprint(
*9c5db199SXin Li                        'Failed to find enough tests for job_idx: %d. The '
*9c5db199SXin Li                        'job should have %d tests, only found %d tests.' %
*9c5db199SXin Li                        (job.job_idx, len(job.tests), tests_in_db_count))
*9c5db199SXin Li                metrics.Counter(
*9c5db199SXin Li                        'chromeos/autotest/result/db_save_failure',
*9c5db199SXin Li                        description='The number of times parse failed to '
*9c5db199SXin Li                        'save job to TKO database.').increment()
*9c5db199SXin Li
*9c5db199SXin Li        # Although the cursor has autocommit, we still need to force it to
*9c5db199SXin Li        # commit existing changes before we can use django models, otherwise
*9c5db199SXin Li        # it will go into deadlock when django models try to start a new
*9c5db199SXin Li        # trasaction while the current one has not finished yet.
*9c5db199SXin Li        db.commit()
*9c5db199SXin Li
*9c5db199SXin Li        # Handle retry job.
*9c5db199SXin Li        orig_afe_job_id = job_keyval.get(constants.RETRY_ORIGINAL_JOB_ID,
*9c5db199SXin Li                                            None)
*9c5db199SXin Li        if orig_afe_job_id:
*9c5db199SXin Li            orig_job_idx = tko_models.Job.objects.get(
*9c5db199SXin Li                    afe_job_id=orig_afe_job_id).job_idx
*9c5db199SXin Li            _invalidate_original_tests(orig_job_idx, job.job_idx)
*9c5db199SXin Li
*9c5db199SXin Li    # Serializing job into a binary file
*9c5db199SXin Li    export_tko_to_file = global_config.global_config.get_config_value(
*9c5db199SXin Li            'AUTOSERV', 'export_tko_job_to_file', type=bool, default=False)
*9c5db199SXin Li
*9c5db199SXin Li    binary_file_name = os.path.join(path, "job.serialize")
*9c5db199SXin Li    if export_tko_to_file:
*9c5db199SXin Li        export_tko_job_to_file(job, jobname, binary_file_name)
*9c5db199SXin Li
*9c5db199SXin Li    if not dry_run:
*9c5db199SXin Li        db.commit()
*9c5db199SXin Li
*9c5db199SXin Li    # Mark GS_OFFLOADER_NO_OFFLOAD in gs_offloader_instructions at the end of
*9c5db199SXin Li    # the function, so any failure, e.g., db connection error, will stop
*9c5db199SXin Li    # gs_offloader_instructions being updated, and logs can be uploaded for
*9c5db199SXin Li    # troubleshooting.
*9c5db199SXin Li    if job_successful:
*9c5db199SXin Li        # Check if we should not offload this test's results.
*9c5db199SXin Li        if job_keyval.get(constants.JOB_OFFLOAD_FAILURES_KEY, False):
*9c5db199SXin Li            # Update the gs_offloader_instructions json file.
*9c5db199SXin Li            gs_instructions_file = os.path.join(
*9c5db199SXin Li                    path, constants.GS_OFFLOADER_INSTRUCTIONS)
*9c5db199SXin Li            gs_offloader_instructions = {}
*9c5db199SXin Li            if os.path.exists(gs_instructions_file):
*9c5db199SXin Li                with open(gs_instructions_file, 'r') as f:
*9c5db199SXin Li                    gs_offloader_instructions = json.load(f)
*9c5db199SXin Li
*9c5db199SXin Li            gs_offloader_instructions[constants.GS_OFFLOADER_NO_OFFLOAD] = True
*9c5db199SXin Li            with open(gs_instructions_file, 'w') as f:
*9c5db199SXin Li                json.dump(gs_offloader_instructions, f)
*9c5db199SXin Li    return job
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _write_job_to_db(db, jobname, job):
*9c5db199SXin Li    """Write all TKO data associated with a job to DB.
*9c5db199SXin Li
*9c5db199SXin Li    This updates the job object as a side effect.
*9c5db199SXin Li
*9c5db199SXin Li    @param db: tko.db.db_sql object.
*9c5db199SXin Li    @param jobname: Name of the job to write.
*9c5db199SXin Li    @param job: tko.models.job object.
*9c5db199SXin Li    """
*9c5db199SXin Li    db.insert_or_update_machine(job)
*9c5db199SXin Li    db.insert_job(jobname, job)
*9c5db199SXin Li    db.insert_or_update_task_reference(
*9c5db199SXin Li            job,
*9c5db199SXin Li            'skylab' if tko_utils.is_skylab_task(jobname) else 'afe',
*9c5db199SXin Li    )
*9c5db199SXin Li    db.update_job_keyvals(job)
*9c5db199SXin Li    for test in job.tests:
*9c5db199SXin Li        db.insert_test(job, test)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _find_status_log_path(path):
*9c5db199SXin Li    if os.path.exists(os.path.join(path, "status.log")):
*9c5db199SXin Li        return os.path.join(path, "status.log")
*9c5db199SXin Li    if os.path.exists(os.path.join(path, "status")):
*9c5db199SXin Li        return os.path.join(path, "status")
*9c5db199SXin Li    return ""
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _parse_status_log(parser, job, status_log_path):
*9c5db199SXin Li    status_lines = open(status_log_path).readlines()
*9c5db199SXin Li    parser.start(job)
*9c5db199SXin Li    tests = parser.end(status_lines)
*9c5db199SXin Li
*9c5db199SXin Li    # parser.end can return the same object multiple times, so filter out dups
*9c5db199SXin Li    job.tests = []
*9c5db199SXin Li    already_added = set()
*9c5db199SXin Li    for test in tests:
*9c5db199SXin Li        if test not in already_added:
*9c5db199SXin Li            already_added.add(test)
*9c5db199SXin Li            job.tests.append(test)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _match_existing_tests(db, job):
*9c5db199SXin Li    """Find entries in the DB corresponding to the job's tests, update job.
*9c5db199SXin Li
*9c5db199SXin Li    @return: Any unmatched tests in the db.
*9c5db199SXin Li    """
*9c5db199SXin Li    old_job_idx = job.job_idx
*9c5db199SXin Li    raw_old_tests = db.select("test_idx,subdir,test", "tko_tests",
*9c5db199SXin Li                                {"job_idx": old_job_idx})
*9c5db199SXin Li    if raw_old_tests:
*9c5db199SXin Li        old_tests = dict(((test, subdir), test_idx)
*9c5db199SXin Li                            for test_idx, subdir, test in raw_old_tests)
*9c5db199SXin Li    else:
*9c5db199SXin Li        old_tests = {}
*9c5db199SXin Li
*9c5db199SXin Li    for test in job.tests:
*9c5db199SXin Li        test_idx = old_tests.pop((test.testname, test.subdir), None)
*9c5db199SXin Li        if test_idx is not None:
*9c5db199SXin Li            test.test_idx = test_idx
*9c5db199SXin Li        else:
*9c5db199SXin Li            tko_utils.dprint("! Reparse returned new test "
*9c5db199SXin Li                                "testname=%r subdir=%r" %
*9c5db199SXin Li                                (test.testname, test.subdir))
*9c5db199SXin Li    return old_tests
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _delete_tests_from_db(db, tests):
*9c5db199SXin Li    for test_idx in six.itervalues(tests):
*9c5db199SXin Li        where = {'test_idx' : test_idx}
*9c5db199SXin Li        db.delete('tko_iteration_result', where)
*9c5db199SXin Li        db.delete('tko_iteration_perf_value', where)
*9c5db199SXin Li        db.delete('tko_iteration_attributes', where)
*9c5db199SXin Li        db.delete('tko_test_attributes', where)
*9c5db199SXin Li        db.delete('tko_test_labels_tests', {'test_id': test_idx})
*9c5db199SXin Li        db.delete('tko_tests', where)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _get_job_subdirs(path):
*9c5db199SXin Li    """
*9c5db199SXin Li    Returns a list of job subdirectories at path. Returns None if the test
*9c5db199SXin Li    is itself a job directory. Does not recurse into the subdirs.
*9c5db199SXin Li    """
*9c5db199SXin Li    # if there's a .machines file, use it to get the subdirs
*9c5db199SXin Li    machine_list = os.path.join(path, ".machines")
*9c5db199SXin Li    if os.path.exists(machine_list):
*9c5db199SXin Li        with open(machine_list, 'r') as ml:
*9c5db199SXin Li            subdirs = set(line.strip() for line in ml.readlines())
*9c5db199SXin Li        existing_subdirs = set(subdir for subdir in subdirs
*9c5db199SXin Li                               if os.path.exists(os.path.join(path, subdir)))
*9c5db199SXin Li        if len(existing_subdirs) != 0:
*9c5db199SXin Li            return existing_subdirs
*9c5db199SXin Li
*9c5db199SXin Li    # if this dir contains ONLY subdirectories, return them
*9c5db199SXin Li    contents = set(os.listdir(path))
*9c5db199SXin Li    contents.discard(".parse.lock")
*9c5db199SXin Li    subdirs = set(sub for sub in contents if
*9c5db199SXin Li                  os.path.isdir(os.path.join(path, sub)))
*9c5db199SXin Li    if len(contents) == len(subdirs) != 0:
*9c5db199SXin Li        return subdirs
*9c5db199SXin Li
*9c5db199SXin Li    # this is a job directory, or something else we don't understand
*9c5db199SXin Li    return None
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef parse_leaf_path(db, pid_file_manager, path, level, parse_options):
*9c5db199SXin Li    """Parse a leaf path.
*9c5db199SXin Li
*9c5db199SXin Li    @param db: database handle.
*9c5db199SXin Li    @param pid_file_manager: pidfile.PidFileManager object.
*9c5db199SXin Li    @param path: The path to the results to be parsed.
*9c5db199SXin Li    @param level: Integer, level of subdirectories to include in the job name.
*9c5db199SXin Li    @param parse_options: _ParseOptions instance.
*9c5db199SXin Li
*9c5db199SXin Li    @returns: The job name of the parsed job, e.g. '123-chromeos-test/host1'
*9c5db199SXin Li    """
*9c5db199SXin Li    job_elements = path.split("/")[-level:]
*9c5db199SXin Li    jobname = "/".join(job_elements)
*9c5db199SXin Li    db.run_with_retry(parse_one, db, pid_file_manager, jobname, path,
*9c5db199SXin Li                      parse_options)
*9c5db199SXin Li    return jobname
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef parse_path(db, pid_file_manager, path, level, parse_options):
*9c5db199SXin Li    """Parse a path
*9c5db199SXin Li
*9c5db199SXin Li    @param db: database handle.
*9c5db199SXin Li    @param pid_file_manager: pidfile.PidFileManager object.
*9c5db199SXin Li    @param path: The path to the results to be parsed.
*9c5db199SXin Li    @param level: Integer, level of subdirectories to include in the job name.
*9c5db199SXin Li    @param parse_options: _ParseOptions instance.
*9c5db199SXin Li
*9c5db199SXin Li    @returns: A set of job names of the parsed jobs.
*9c5db199SXin Li              set(['123-chromeos-test/host1', '123-chromeos-test/host2'])
*9c5db199SXin Li    """
*9c5db199SXin Li    processed_jobs = set()
*9c5db199SXin Li    job_subdirs = _get_job_subdirs(path)
*9c5db199SXin Li    if job_subdirs is not None:
*9c5db199SXin Li        # parse status.log in current directory, if it exists. multi-machine
*9c5db199SXin Li        # synchronous server side tests record output in this directory. without
*9c5db199SXin Li        # this check, we do not parse these results.
*9c5db199SXin Li        if os.path.exists(os.path.join(path, 'status.log')):
*9c5db199SXin Li            new_job = parse_leaf_path(db, pid_file_manager, path, level,
*9c5db199SXin Li                                      parse_options)
*9c5db199SXin Li            processed_jobs.add(new_job)
*9c5db199SXin Li        # multi-machine job
*9c5db199SXin Li        for subdir in job_subdirs:
*9c5db199SXin Li            jobpath = os.path.join(path, subdir)
*9c5db199SXin Li            new_jobs = parse_path(db, pid_file_manager, jobpath, level + 1,
*9c5db199SXin Li                                  parse_options)
*9c5db199SXin Li            processed_jobs.update(new_jobs)
*9c5db199SXin Li    else:
*9c5db199SXin Li        # single machine job
*9c5db199SXin Li        new_job = parse_leaf_path(db, pid_file_manager, path, level,
*9c5db199SXin Li                                  parse_options)
*9c5db199SXin Li        processed_jobs.add(new_job)
*9c5db199SXin Li    return processed_jobs
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _detach_from_parent_process():
*9c5db199SXin Li    """Allow reparenting the parse process away from caller.
*9c5db199SXin Li
*9c5db199SXin Li    When monitor_db is run via upstart, restarting the job sends SIGTERM to
*9c5db199SXin Li    the whole process group. This makes us immune from that.
*9c5db199SXin Li    """
*9c5db199SXin Li    if os.getpid() != os.getpgid(0):
*9c5db199SXin Li        os.setsid()
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef main():
*9c5db199SXin Li    """tko_parse entry point."""
*9c5db199SXin Li    options, args = parse_args()
*9c5db199SXin Li
*9c5db199SXin Li    # We are obliged to use indirect=False, not use the SetupTsMonGlobalState
*9c5db199SXin Li    # context manager, and add a manual flush, because tko/parse is expected to
*9c5db199SXin Li    # be a very short lived (<1 min) script when working effectively, and we
*9c5db199SXin Li    # can't afford to either a) wait for up to 1min for metrics to flush at the
*9c5db199SXin Li    # end or b) drop metrics that were sent within the last minute of execution.
*9c5db199SXin Li    site_utils.SetupTsMonGlobalState('tko_parse', indirect=False,
*9c5db199SXin Li                                     short_lived=True)
*9c5db199SXin Li    try:
*9c5db199SXin Li        with metrics.SuccessCounter('chromeos/autotest/tko_parse/runs'):
*9c5db199SXin Li            _main_with_options(options, args)
*9c5db199SXin Li    finally:
*9c5db199SXin Li        metrics.Flush()
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _main_with_options(options, args):
*9c5db199SXin Li    """Entry point with options parsed and metrics already set up."""
*9c5db199SXin Li    # Record the processed jobs so that
*9c5db199SXin Li    # we can send the duration of parsing to metadata db.
*9c5db199SXin Li    processed_jobs = set()
*9c5db199SXin Li
*9c5db199SXin Li    if options.detach:
*9c5db199SXin Li        _detach_from_parent_process()
*9c5db199SXin Li
*9c5db199SXin Li    results_dir = os.path.abspath(args[0])
*9c5db199SXin Li    assert os.path.exists(results_dir)
*9c5db199SXin Li
*9c5db199SXin Li    _update_db_config_from_json(options, results_dir)
*9c5db199SXin Li
*9c5db199SXin Li    parse_options = _ParseOptions(options.reparse, options.mailit,
*9c5db199SXin Li                                  options.dry_run, options.suite_report,
*9c5db199SXin Li                                  options.datastore_creds,
*9c5db199SXin Li                                  options.export_to_gcloud_path,
*9c5db199SXin Li                                  options.disable_perf_upload)
*9c5db199SXin Li
*9c5db199SXin Li    pid_file_manager = pidfile.PidFileManager("parser", results_dir)
*9c5db199SXin Li
*9c5db199SXin Li    if options.write_pidfile:
*9c5db199SXin Li        pid_file_manager.open_file()
*9c5db199SXin Li
*9c5db199SXin Li    try:
*9c5db199SXin Li        # build up the list of job dirs to parse
*9c5db199SXin Li        if options.singledir:
*9c5db199SXin Li            jobs_list = [results_dir]
*9c5db199SXin Li        else:
*9c5db199SXin Li            jobs_list = [os.path.join(results_dir, subdir)
*9c5db199SXin Li                         for subdir in os.listdir(results_dir)]
*9c5db199SXin Li
*9c5db199SXin Li        # build up the database
*9c5db199SXin Li        db = tko_db.db(autocommit=False, host=options.db_host,
*9c5db199SXin Li                       user=options.db_user, password=options.db_pass,
*9c5db199SXin Li                       database=options.db_name)
*9c5db199SXin Li
*9c5db199SXin Li        # parse all the jobs
*9c5db199SXin Li        for path in jobs_list:
*9c5db199SXin Li            lockfile = open(os.path.join(path, ".parse.lock"), "w")
*9c5db199SXin Li            flags = fcntl.LOCK_EX
*9c5db199SXin Li            if options.noblock:
*9c5db199SXin Li                flags |= fcntl.LOCK_NB
*9c5db199SXin Li            try:
*9c5db199SXin Li                fcntl.flock(lockfile, flags)
*9c5db199SXin Li            except IOError as e:
*9c5db199SXin Li                # lock is not available and nonblock has been requested
*9c5db199SXin Li                if e.errno == errno.EWOULDBLOCK:
*9c5db199SXin Li                    lockfile.close()
*9c5db199SXin Li                    continue
*9c5db199SXin Li                else:
*9c5db199SXin Li                    raise # something unexpected happened
*9c5db199SXin Li            try:
*9c5db199SXin Li                new_jobs = parse_path(db, pid_file_manager, path, options.level,
*9c5db199SXin Li                                      parse_options)
*9c5db199SXin Li                processed_jobs.update(new_jobs)
*9c5db199SXin Li
*9c5db199SXin Li            finally:
*9c5db199SXin Li                fcntl.flock(lockfile, fcntl.LOCK_UN)
*9c5db199SXin Li                lockfile.close()
*9c5db199SXin Li
*9c5db199SXin Li    except Exception as e:
*9c5db199SXin Li        pid_file_manager.close_file(1)
*9c5db199SXin Li        raise
*9c5db199SXin Li    else:
*9c5db199SXin Li        pid_file_manager.close_file(0)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Lidef _update_db_config_from_json(options, test_results_dir):
*9c5db199SXin Li    """Uptade DB config options using a side_effects_config.json file.
*9c5db199SXin Li
*9c5db199SXin Li    @param options: parsed args to be updated.
*9c5db199SXin Li    @param test_results_dir: path to test results dir.
*9c5db199SXin Li
*9c5db199SXin Li    @raises: json_format.ParseError if the file is not a valid JSON.
*9c5db199SXin Li             ValueError if the JSON config is incomplete.
*9c5db199SXin Li             OSError if some files from the JSON config are missing.
*9c5db199SXin Li    """
*9c5db199SXin Li    # results_dir passed to tko/parse is a subdir of the root results dir
*9c5db199SXin Li    config_dir = os.path.join(test_results_dir, os.pardir)
*9c5db199SXin Li    tko_utils.dprint("Attempting to read side_effects.Config from %s" %
*9c5db199SXin Li        config_dir)
*9c5db199SXin Li    config = config_loader.load(config_dir)
*9c5db199SXin Li
*9c5db199SXin Li    if config:
*9c5db199SXin Li        tko_utils.dprint("Validating side_effects.Config.tko")
*9c5db199SXin Li        config_loader.validate_tko(config)
*9c5db199SXin Li
*9c5db199SXin Li        tko_utils.dprint("Using the following DB config params from "
*9c5db199SXin Li            "side_effects.Config.tko:\n%s" % config.tko)
*9c5db199SXin Li        options.db_host = config.tko.proxy_socket
*9c5db199SXin Li        options.db_user = config.tko.mysql_user
*9c5db199SXin Li
*9c5db199SXin Li        with open(config.tko.mysql_password_file, 'r') as f:
*9c5db199SXin Li            options.db_pass = f.read().rstrip('\n')
*9c5db199SXin Li
*9c5db199SXin Li        options.disable_perf_upload = not config.chrome_perf.enabled
*9c5db199SXin Li    else:
*9c5db199SXin Li        tko_utils.dprint("No side_effects.Config found in %s - "
*9c5db199SXin Li            "defaulting to DB config values from shadow config" % config_dir)
*9c5db199SXin Li
*9c5db199SXin Li
*9c5db199SXin Liif __name__ == "__main__":
*9c5db199SXin Li    main()