i915/gt/selftest_execlists.c

0001 // SPDX-License-Identifier: MIT
0002 /*
0003  * Copyright © 2018 Intel Corporation
0004  */
0005
0006 #include <linux/prime_numbers.h>
0007
0008 #include "gem/i915_gem_internal.h"
0009 #include "gem/i915_gem_pm.h"
0010 #include "gt/intel_engine_heartbeat.h"
0011 #include "gt/intel_reset.h"
0012 #include "gt/selftest_engine_heartbeat.h"
0013
0014 #include "i915_selftest.h"
0015 #include "selftests/i915_random.h"
0016 #include "selftests/igt_flush_test.h"
0017 #include "selftests/igt_live_test.h"
0018 #include "selftests/igt_spinner.h"
0019 #include "selftests/lib_sw_fence.h"
0020
0021 #include "gem/selftests/igt_gem_utils.h"
0022 #include "gem/selftests/mock_context.h"
0023
0024 #define CS_GPR(engine, n) ((engine)->mmio_base + 0x600 + (n) * 4)
0025 #define NUM_GPR 16
0026 #define NUM_GPR_DW (NUM_GPR * 2) /* each GPR is 2 dwords */
0027
0028 static bool is_active(struct i915_request *rq)
0029 {
0030     if (i915_request_is_active(rq))
0031         return true;
0032
0033     if (i915_request_on_hold(rq))
0034         return true;
0035
0036     if (i915_request_has_initial_breadcrumb(rq) && i915_request_started(rq))
0037         return true;
0038
0039     return false;
0040 }
0041
0042 static int wait_for_submit(struct intel_engine_cs *engine,
0043                struct i915_request *rq,
0044                unsigned long timeout)
0045 {
0046     /* Ignore our own attempts to suppress excess tasklets */
0047     tasklet_hi_schedule(&engine->sched_engine->tasklet);
0048
0049     timeout += jiffies;
0050     do {
0051         bool done = time_after(jiffies, timeout);
0052
0053         if (i915_request_completed(rq)) /* that was quick! */
0054             return 0;
0055
0056         /* Wait until the HW has acknowleged the submission (or err) */
0057         intel_engine_flush_submission(engine);
0058         if (!READ_ONCE(engine->execlists.pending[0]) && is_active(rq))
0059             return 0;
0060
0061         if (done)
0062             return -ETIME;
0063
0064         cond_resched();
0065     } while (1);
0066 }
0067
0068 static int wait_for_reset(struct intel_engine_cs *engine,
0069               struct i915_request *rq,
0070               unsigned long timeout)
0071 {
0072     timeout += jiffies;
0073
0074     do {
0075         cond_resched();
0076         intel_engine_flush_submission(engine);
0077
0078         if (READ_ONCE(engine->execlists.pending[0]))
0079             continue;
0080
0081         if (i915_request_completed(rq))
0082             break;
0083
0084         if (READ_ONCE(rq->fence.error))
0085             break;
0086     } while (time_before(jiffies, timeout));
0087
0088     flush_scheduled_work();
0089
0090     if (rq->fence.error != -EIO) {
0091         pr_err("%s: hanging request %llx:%lld not reset\n",
0092                engine->name,
0093                rq->fence.context,
0094                rq->fence.seqno);
0095         return -EINVAL;
0096     }
0097
0098     /* Give the request a jiffie to complete after flushing the worker */
0099     if (i915_request_wait(rq, 0,
0100                   max(0l, (long)(timeout - jiffies)) + 1) < 0) {
0101         pr_err("%s: hanging request %llx:%lld did not complete\n",
0102                engine->name,
0103                rq->fence.context,
0104                rq->fence.seqno);
0105         return -ETIME;
0106     }
0107
0108     return 0;
0109 }
0110
0111 static int live_sanitycheck(void *arg)
0112 {
0113     struct intel_gt *gt = arg;
0114     struct intel_engine_cs *engine;
0115     enum intel_engine_id id;
0116     struct igt_spinner spin;
0117     int err = 0;
0118
0119     if (!HAS_LOGICAL_RING_CONTEXTS(gt->i915))
0120         return 0;
0121
0122     if (igt_spinner_init(&spin, gt))
0123         return -ENOMEM;
0124
0125     for_each_engine(engine, gt, id) {
0126         struct intel_context *ce;
0127         struct i915_request *rq;
0128
0129         ce = intel_context_create(engine);
0130         if (IS_ERR(ce)) {
0131             err = PTR_ERR(ce);
0132             break;
0133         }
0134
0135         rq = igt_spinner_create_request(&spin, ce, MI_NOOP);
0136         if (IS_ERR(rq)) {
0137             err = PTR_ERR(rq);
0138             goto out_ctx;
0139         }
0140
0141         i915_request_add(rq);
0142         if (!igt_wait_for_spinner(&spin, rq)) {
0143             GEM_TRACE("spinner failed to start\n");
0144             GEM_TRACE_DUMP();
0145             intel_gt_set_wedged(gt);
0146             err = -EIO;
0147             goto out_ctx;
0148         }
0149
0150         igt_spinner_end(&spin);
0151         if (igt_flush_test(gt->i915)) {
0152             err = -EIO;
0153             goto out_ctx;
0154         }
0155
0156 out_ctx:
0157         intel_context_put(ce);
0158         if (err)
0159             break;
0160     }
0161
0162     igt_spinner_fini(&spin);
0163     return err;
0164 }
0165
0166 static int live_unlite_restore(struct intel_gt *gt, int prio)
0167 {
0168     struct intel_engine_cs *engine;
0169     enum intel_engine_id id;
0170     struct igt_spinner spin;
0171     int err = -ENOMEM;
0172
0173     /*
0174      * Check that we can correctly context switch between 2 instances
0175      * on the same engine from the same parent context.
0176      */
0177
0178     if (igt_spinner_init(&spin, gt))
0179         return err;
0180
0181     err = 0;
0182     for_each_engine(engine, gt, id) {
0183         struct intel_context *ce[2] = {};
0184         struct i915_request *rq[2];
0185         struct igt_live_test t;
0186         int n;
0187
0188         if (prio && !intel_engine_has_preemption(engine))
0189             continue;
0190
0191         if (!intel_engine_can_store_dword(engine))
0192             continue;
0193
0194         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
0195             err = -EIO;
0196             break;
0197         }
0198         st_engine_heartbeat_disable(engine);
0199
0200         for (n = 0; n < ARRAY_SIZE(ce); n++) {
0201             struct intel_context *tmp;
0202
0203             tmp = intel_context_create(engine);
0204             if (IS_ERR(tmp)) {
0205                 err = PTR_ERR(tmp);
0206                 goto err_ce;
0207             }
0208
0209             err = intel_context_pin(tmp);
0210             if (err) {
0211                 intel_context_put(tmp);
0212                 goto err_ce;
0213             }
0214
0215             /*
0216              * Setup the pair of contexts such that if we
0217              * lite-restore using the RING_TAIL from ce[1] it
0218              * will execute garbage from ce[0]->ring.
0219              */
0220             memset(tmp->ring->vaddr,
0221                    POISON_INUSE, /* IPEHR: 0x5a5a5a5a [hung!] */
0222                    tmp->ring->vma->size);
0223
0224             ce[n] = tmp;
0225         }
0226         GEM_BUG_ON(!ce[1]->ring->size);
0227         intel_ring_reset(ce[1]->ring, ce[1]->ring->size / 2);
0228         lrc_update_regs(ce[1], engine, ce[1]->ring->head);
0229
0230         rq[0] = igt_spinner_create_request(&spin, ce[0], MI_ARB_CHECK);
0231         if (IS_ERR(rq[0])) {
0232             err = PTR_ERR(rq[0]);
0233             goto err_ce;
0234         }
0235
0236         i915_request_get(rq[0]);
0237         i915_request_add(rq[0]);
0238         GEM_BUG_ON(rq[0]->postfix > ce[1]->ring->emit);
0239
0240         if (!igt_wait_for_spinner(&spin, rq[0])) {
0241             i915_request_put(rq[0]);
0242             goto err_ce;
0243         }
0244
0245         rq[1] = i915_request_create(ce[1]);
0246         if (IS_ERR(rq[1])) {
0247             err = PTR_ERR(rq[1]);
0248             i915_request_put(rq[0]);
0249             goto err_ce;
0250         }
0251
0252         if (!prio) {
0253             /*
0254              * Ensure we do the switch to ce[1] on completion.
0255              *
0256              * rq[0] is already submitted, so this should reduce
0257              * to a no-op (a wait on a request on the same engine
0258              * uses the submit fence, not the completion fence),
0259              * but it will install a dependency on rq[1] for rq[0]
0260              * that will prevent the pair being reordered by
0261              * timeslicing.
0262              */
0263             i915_request_await_dma_fence(rq[1], &rq[0]->fence);
0264         }
0265
0266         i915_request_get(rq[1]);
0267         i915_request_add(rq[1]);
0268         GEM_BUG_ON(rq[1]->postfix <= rq[0]->postfix);
0269         i915_request_put(rq[0]);
0270
0271         if (prio) {
0272             struct i915_sched_attr attr = {
0273                 .priority = prio,
0274             };
0275
0276             /* Alternatively preempt the spinner with ce[1] */
0277             engine->sched_engine->schedule(rq[1], &attr);
0278         }
0279
0280         /* And switch back to ce[0] for good measure */
0281         rq[0] = i915_request_create(ce[0]);
0282         if (IS_ERR(rq[0])) {
0283             err = PTR_ERR(rq[0]);
0284             i915_request_put(rq[1]);
0285             goto err_ce;
0286         }
0287
0288         i915_request_await_dma_fence(rq[0], &rq[1]->fence);
0289         i915_request_get(rq[0]);
0290         i915_request_add(rq[0]);
0291         GEM_BUG_ON(rq[0]->postfix > rq[1]->postfix);
0292         i915_request_put(rq[1]);
0293         i915_request_put(rq[0]);
0294
0295 err_ce:
0296         intel_engine_flush_submission(engine);
0297         igt_spinner_end(&spin);
0298         for (n = 0; n < ARRAY_SIZE(ce); n++) {
0299             if (IS_ERR_OR_NULL(ce[n]))
0300                 break;
0301
0302             intel_context_unpin(ce[n]);
0303             intel_context_put(ce[n]);
0304         }
0305
0306         st_engine_heartbeat_enable(engine);
0307         if (igt_live_test_end(&t))
0308             err = -EIO;
0309         if (err)
0310             break;
0311     }
0312
0313     igt_spinner_fini(&spin);
0314     return err;
0315 }
0316
0317 static int live_unlite_switch(void *arg)
0318 {
0319     return live_unlite_restore(arg, 0);
0320 }
0321
0322 static int live_unlite_preempt(void *arg)
0323 {
0324     return live_unlite_restore(arg, I915_PRIORITY_MAX);
0325 }
0326
0327 static int live_unlite_ring(void *arg)
0328 {
0329     struct intel_gt *gt = arg;
0330     struct intel_engine_cs *engine;
0331     struct igt_spinner spin;
0332     enum intel_engine_id id;
0333     int err = 0;
0334
0335     /*
0336      * Setup a preemption event that will cause almost the entire ring
0337      * to be unwound, potentially fooling our intel_ring_direction()
0338      * into emitting a forward lite-restore instead of the rollback.
0339      */
0340
0341     if (igt_spinner_init(&spin, gt))
0342         return -ENOMEM;
0343
0344     for_each_engine(engine, gt, id) {
0345         struct intel_context *ce[2] = {};
0346         struct i915_request *rq;
0347         struct igt_live_test t;
0348         int n;
0349
0350         if (!intel_engine_has_preemption(engine))
0351             continue;
0352
0353         if (!intel_engine_can_store_dword(engine))
0354             continue;
0355
0356         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
0357             err = -EIO;
0358             break;
0359         }
0360         st_engine_heartbeat_disable(engine);
0361
0362         for (n = 0; n < ARRAY_SIZE(ce); n++) {
0363             struct intel_context *tmp;
0364
0365             tmp = intel_context_create(engine);
0366             if (IS_ERR(tmp)) {
0367                 err = PTR_ERR(tmp);
0368                 goto err_ce;
0369             }
0370
0371             err = intel_context_pin(tmp);
0372             if (err) {
0373                 intel_context_put(tmp);
0374                 goto err_ce;
0375             }
0376
0377             memset32(tmp->ring->vaddr,
0378                  0xdeadbeef, /* trigger a hang if executed */
0379                  tmp->ring->vma->size / sizeof(u32));
0380
0381             ce[n] = tmp;
0382         }
0383
0384         /* Create max prio spinner, followed by N low prio nops */
0385         rq = igt_spinner_create_request(&spin, ce[0], MI_ARB_CHECK);
0386         if (IS_ERR(rq)) {
0387             err = PTR_ERR(rq);
0388             goto err_ce;
0389         }
0390
0391         i915_request_get(rq);
0392         rq->sched.attr.priority = I915_PRIORITY_BARRIER;
0393         i915_request_add(rq);
0394
0395         if (!igt_wait_for_spinner(&spin, rq)) {
0396             intel_gt_set_wedged(gt);
0397             i915_request_put(rq);
0398             err = -ETIME;
0399             goto err_ce;
0400         }
0401
0402         /* Fill the ring, until we will cause a wrap */
0403         n = 0;
0404         while (intel_ring_direction(ce[0]->ring,
0405                         rq->wa_tail,
0406                         ce[0]->ring->tail) <= 0) {
0407             struct i915_request *tmp;
0408
0409             tmp = intel_context_create_request(ce[0]);
0410             if (IS_ERR(tmp)) {
0411                 err = PTR_ERR(tmp);
0412                 i915_request_put(rq);
0413                 goto err_ce;
0414             }
0415
0416             i915_request_add(tmp);
0417             intel_engine_flush_submission(engine);
0418             n++;
0419         }
0420         intel_engine_flush_submission(engine);
0421         pr_debug("%s: Filled ring with %d nop tails {size:%x, tail:%x, emit:%x, rq.tail:%x}\n",
0422              engine->name, n,
0423              ce[0]->ring->size,
0424              ce[0]->ring->tail,
0425              ce[0]->ring->emit,
0426              rq->tail);
0427         GEM_BUG_ON(intel_ring_direction(ce[0]->ring,
0428                         rq->tail,
0429                         ce[0]->ring->tail) <= 0);
0430         i915_request_put(rq);
0431
0432         /* Create a second ring to preempt the first ring after rq[0] */
0433         rq = intel_context_create_request(ce[1]);
0434         if (IS_ERR(rq)) {
0435             err = PTR_ERR(rq);
0436             goto err_ce;
0437         }
0438
0439         rq->sched.attr.priority = I915_PRIORITY_BARRIER;
0440         i915_request_get(rq);
0441         i915_request_add(rq);
0442
0443         err = wait_for_submit(engine, rq, HZ / 2);
0444         i915_request_put(rq);
0445         if (err) {
0446             pr_err("%s: preemption request was not submitted\n",
0447                    engine->name);
0448             err = -ETIME;
0449         }
0450
0451         pr_debug("%s: ring[0]:{ tail:%x, emit:%x }, ring[1]:{ tail:%x, emit:%x }\n",
0452              engine->name,
0453              ce[0]->ring->tail, ce[0]->ring->emit,
0454              ce[1]->ring->tail, ce[1]->ring->emit);
0455
0456 err_ce:
0457         intel_engine_flush_submission(engine);
0458         igt_spinner_end(&spin);
0459         for (n = 0; n < ARRAY_SIZE(ce); n++) {
0460             if (IS_ERR_OR_NULL(ce[n]))
0461                 break;
0462
0463             intel_context_unpin(ce[n]);
0464             intel_context_put(ce[n]);
0465         }
0466         st_engine_heartbeat_enable(engine);
0467         if (igt_live_test_end(&t))
0468             err = -EIO;
0469         if (err)
0470             break;
0471     }
0472
0473     igt_spinner_fini(&spin);
0474     return err;
0475 }
0476
0477 static int live_pin_rewind(void *arg)
0478 {
0479     struct intel_gt *gt = arg;
0480     struct intel_engine_cs *engine;
0481     enum intel_engine_id id;
0482     int err = 0;
0483
0484     /*
0485      * We have to be careful not to trust intel_ring too much, for example
0486      * ring->head is updated upon retire which is out of sync with pinning
0487      * the context. Thus we cannot use ring->head to set CTX_RING_HEAD,
0488      * or else we risk writing an older, stale value.
0489      *
0490      * To simulate this, let's apply a bit of deliberate sabotague.
0491      */
0492
0493     for_each_engine(engine, gt, id) {
0494         struct intel_context *ce;
0495         struct i915_request *rq;
0496         struct intel_ring *ring;
0497         struct igt_live_test t;
0498
0499         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
0500             err = -EIO;
0501             break;
0502         }
0503
0504         ce = intel_context_create(engine);
0505         if (IS_ERR(ce)) {
0506             err = PTR_ERR(ce);
0507             break;
0508         }
0509
0510         err = intel_context_pin(ce);
0511         if (err) {
0512             intel_context_put(ce);
0513             break;
0514         }
0515
0516         /* Keep the context awake while we play games */
0517         err = i915_active_acquire(&ce->active);
0518         if (err) {
0519             intel_context_unpin(ce);
0520             intel_context_put(ce);
0521             break;
0522         }
0523         ring = ce->ring;
0524
0525         /* Poison the ring, and offset the next request from HEAD */
0526         memset32(ring->vaddr, STACK_MAGIC, ring->size / sizeof(u32));
0527         ring->emit = ring->size / 2;
0528         ring->tail = ring->emit;
0529         GEM_BUG_ON(ring->head);
0530
0531         intel_context_unpin(ce);
0532
0533         /* Submit a simple nop request */
0534         GEM_BUG_ON(intel_context_is_pinned(ce));
0535         rq = intel_context_create_request(ce);
0536         i915_active_release(&ce->active); /* e.g. async retire */
0537         intel_context_put(ce);
0538         if (IS_ERR(rq)) {
0539             err = PTR_ERR(rq);
0540             break;
0541         }
0542         GEM_BUG_ON(!rq->head);
0543         i915_request_add(rq);
0544
0545         /* Expect not to hang! */
0546         if (igt_live_test_end(&t)) {
0547             err = -EIO;
0548             break;
0549         }
0550     }
0551
0552     return err;
0553 }
0554
0555 static int engine_lock_reset_tasklet(struct intel_engine_cs *engine)
0556 {
0557     tasklet_disable(&engine->sched_engine->tasklet);
0558     local_bh_disable();
0559
0560     if (test_and_set_bit(I915_RESET_ENGINE + engine->id,
0561                  &engine->gt->reset.flags)) {
0562         local_bh_enable();
0563         tasklet_enable(&engine->sched_engine->tasklet);
0564
0565         intel_gt_set_wedged(engine->gt);
0566         return -EBUSY;
0567     }
0568
0569     return 0;
0570 }
0571
0572 static void engine_unlock_reset_tasklet(struct intel_engine_cs *engine)
0573 {
0574     clear_and_wake_up_bit(I915_RESET_ENGINE + engine->id,
0575                   &engine->gt->reset.flags);
0576
0577     local_bh_enable();
0578     tasklet_enable(&engine->sched_engine->tasklet);
0579 }
0580
0581 static int live_hold_reset(void *arg)
0582 {
0583     struct intel_gt *gt = arg;
0584     struct intel_engine_cs *engine;
0585     enum intel_engine_id id;
0586     struct igt_spinner spin;
0587     int err = 0;
0588
0589     /*
0590      * In order to support offline error capture for fast preempt reset,
0591      * we need to decouple the guilty request and ensure that it and its
0592      * descendents are not executed while the capture is in progress.
0593      */
0594
0595     if (!intel_has_reset_engine(gt))
0596         return 0;
0597
0598     if (igt_spinner_init(&spin, gt))
0599         return -ENOMEM;
0600
0601     for_each_engine(engine, gt, id) {
0602         struct intel_context *ce;
0603         struct i915_request *rq;
0604
0605         ce = intel_context_create(engine);
0606         if (IS_ERR(ce)) {
0607             err = PTR_ERR(ce);
0608             break;
0609         }
0610
0611         st_engine_heartbeat_disable(engine);
0612
0613         rq = igt_spinner_create_request(&spin, ce, MI_ARB_CHECK);
0614         if (IS_ERR(rq)) {
0615             err = PTR_ERR(rq);
0616             goto out;
0617         }
0618         i915_request_add(rq);
0619
0620         if (!igt_wait_for_spinner(&spin, rq)) {
0621             intel_gt_set_wedged(gt);
0622             err = -ETIME;
0623             goto out;
0624         }
0625
0626         /* We have our request executing, now remove it and reset */
0627
0628         err = engine_lock_reset_tasklet(engine);
0629         if (err)
0630             goto out;
0631
0632         engine->sched_engine->tasklet.callback(&engine->sched_engine->tasklet);
0633         GEM_BUG_ON(execlists_active(&engine->execlists) != rq);
0634
0635         i915_request_get(rq);
0636         execlists_hold(engine, rq);
0637         GEM_BUG_ON(!i915_request_on_hold(rq));
0638
0639         __intel_engine_reset_bh(engine, NULL);
0640         GEM_BUG_ON(rq->fence.error != -EIO);
0641
0642         engine_unlock_reset_tasklet(engine);
0643
0644         /* Check that we do not resubmit the held request */
0645         if (!i915_request_wait(rq, 0, HZ / 5)) {
0646             pr_err("%s: on hold request completed!\n",
0647                    engine->name);
0648             i915_request_put(rq);
0649             err = -EIO;
0650             goto out;
0651         }
0652         GEM_BUG_ON(!i915_request_on_hold(rq));
0653
0654         /* But is resubmitted on release */
0655         execlists_unhold(engine, rq);
0656         if (i915_request_wait(rq, 0, HZ / 5) < 0) {
0657             pr_err("%s: held request did not complete!\n",
0658                    engine->name);
0659             intel_gt_set_wedged(gt);
0660             err = -ETIME;
0661         }
0662         i915_request_put(rq);
0663
0664 out:
0665         st_engine_heartbeat_enable(engine);
0666         intel_context_put(ce);
0667         if (err)
0668             break;
0669     }
0670
0671     igt_spinner_fini(&spin);
0672     return err;
0673 }
0674
0675 static const char *error_repr(int err)
0676 {
0677     return err ? "bad" : "good";
0678 }
0679
0680 static int live_error_interrupt(void *arg)
0681 {
0682     static const struct error_phase {
0683         enum { GOOD = 0, BAD = -EIO } error[2];
0684     } phases[] = {
0685         { { BAD,  GOOD } },
0686         { { BAD,  BAD  } },
0687         { { BAD,  GOOD } },
0688         { { GOOD, GOOD } }, /* sentinel */
0689     };
0690     struct intel_gt *gt = arg;
0691     struct intel_engine_cs *engine;
0692     enum intel_engine_id id;
0693
0694     /*
0695      * We hook up the CS_MASTER_ERROR_INTERRUPT to have forewarning
0696      * of invalid commands in user batches that will cause a GPU hang.
0697      * This is a faster mechanism than using hangcheck/heartbeats, but
0698      * only detects problems the HW knows about -- it will not warn when
0699      * we kill the HW!
0700      *
0701      * To verify our detection and reset, we throw some invalid commands
0702      * at the HW and wait for the interrupt.
0703      */
0704
0705     if (!intel_has_reset_engine(gt))
0706         return 0;
0707
0708     for_each_engine(engine, gt, id) {
0709         const struct error_phase *p;
0710         int err = 0;
0711
0712         st_engine_heartbeat_disable(engine);
0713
0714         for (p = phases; p->error[0] != GOOD; p++) {
0715             struct i915_request *client[ARRAY_SIZE(phases->error)];
0716             u32 *cs;
0717             int i;
0718
0719             memset(client, 0, sizeof(*client));
0720             for (i = 0; i < ARRAY_SIZE(client); i++) {
0721                 struct intel_context *ce;
0722                 struct i915_request *rq;
0723
0724                 ce = intel_context_create(engine);
0725                 if (IS_ERR(ce)) {
0726                     err = PTR_ERR(ce);
0727                     goto out;
0728                 }
0729
0730                 rq = intel_context_create_request(ce);
0731                 intel_context_put(ce);
0732                 if (IS_ERR(rq)) {
0733                     err = PTR_ERR(rq);
0734                     goto out;
0735                 }
0736
0737                 if (rq->engine->emit_init_breadcrumb) {
0738                     err = rq->engine->emit_init_breadcrumb(rq);
0739                     if (err) {
0740                         i915_request_add(rq);
0741                         goto out;
0742                     }
0743                 }
0744
0745                 cs = intel_ring_begin(rq, 2);
0746                 if (IS_ERR(cs)) {
0747                     i915_request_add(rq);
0748                     err = PTR_ERR(cs);
0749                     goto out;
0750                 }
0751
0752                 if (p->error[i]) {
0753                     *cs++ = 0xdeadbeef;
0754                     *cs++ = 0xdeadbeef;
0755                 } else {
0756                     *cs++ = MI_NOOP;
0757                     *cs++ = MI_NOOP;
0758                 }
0759
0760                 client[i] = i915_request_get(rq);
0761                 i915_request_add(rq);
0762             }
0763
0764             err = wait_for_submit(engine, client[0], HZ / 2);
0765             if (err) {
0766                 pr_err("%s: first request did not start within time!\n",
0767                        engine->name);
0768                 err = -ETIME;
0769                 goto out;
0770             }
0771
0772             for (i = 0; i < ARRAY_SIZE(client); i++) {
0773                 if (i915_request_wait(client[i], 0, HZ / 5) < 0)
0774                     pr_debug("%s: %s request incomplete!\n",
0775                          engine->name,
0776                          error_repr(p->error[i]));
0777
0778                 if (!i915_request_started(client[i])) {
0779                     pr_err("%s: %s request not started!\n",
0780                            engine->name,
0781                            error_repr(p->error[i]));
0782                     err = -ETIME;
0783                     goto out;
0784                 }
0785
0786                 /* Kick the tasklet to process the error */
0787                 intel_engine_flush_submission(engine);
0788                 if (client[i]->fence.error != p->error[i]) {
0789                     pr_err("%s: %s request (%s) with wrong error code: %d\n",
0790                            engine->name,
0791                            error_repr(p->error[i]),
0792                            i915_request_completed(client[i]) ? "completed" : "running",
0793                            client[i]->fence.error);
0794                     err = -EINVAL;
0795                     goto out;
0796                 }
0797             }
0798
0799 out:
0800             for (i = 0; i < ARRAY_SIZE(client); i++)
0801                 if (client[i])
0802                     i915_request_put(client[i]);
0803             if (err) {
0804                 pr_err("%s: failed at phase[%zd] { %d, %d }\n",
0805                        engine->name, p - phases,
0806                        p->error[0], p->error[1]);
0807                 break;
0808             }
0809         }
0810
0811         st_engine_heartbeat_enable(engine);
0812         if (err) {
0813             intel_gt_set_wedged(gt);
0814             return err;
0815         }
0816     }
0817
0818     return 0;
0819 }
0820
0821 static int
0822 emit_semaphore_chain(struct i915_request *rq, struct i915_vma *vma, int idx)
0823 {
0824     u32 *cs;
0825
0826     cs = intel_ring_begin(rq, 10);
0827     if (IS_ERR(cs))
0828         return PTR_ERR(cs);
0829
0830     *cs++ = MI_ARB_ON_OFF | MI_ARB_ENABLE;
0831
0832     *cs++ = MI_SEMAPHORE_WAIT |
0833         MI_SEMAPHORE_GLOBAL_GTT |
0834         MI_SEMAPHORE_POLL |
0835         MI_SEMAPHORE_SAD_NEQ_SDD;
0836     *cs++ = 0;
0837     *cs++ = i915_ggtt_offset(vma) + 4 * idx;
0838     *cs++ = 0;
0839
0840     if (idx > 0) {
0841         *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
0842         *cs++ = i915_ggtt_offset(vma) + 4 * (idx - 1);
0843         *cs++ = 0;
0844         *cs++ = 1;
0845     } else {
0846         *cs++ = MI_NOOP;
0847         *cs++ = MI_NOOP;
0848         *cs++ = MI_NOOP;
0849         *cs++ = MI_NOOP;
0850     }
0851
0852     *cs++ = MI_ARB_ON_OFF | MI_ARB_DISABLE;
0853
0854     intel_ring_advance(rq, cs);
0855     return 0;
0856 }
0857
0858 static struct i915_request *
0859 semaphore_queue(struct intel_engine_cs *engine, struct i915_vma *vma, int idx)
0860 {
0861     struct intel_context *ce;
0862     struct i915_request *rq;
0863     int err;
0864
0865     ce = intel_context_create(engine);
0866     if (IS_ERR(ce))
0867         return ERR_CAST(ce);
0868
0869     rq = intel_context_create_request(ce);
0870     if (IS_ERR(rq))
0871         goto out_ce;
0872
0873     err = 0;
0874     if (rq->engine->emit_init_breadcrumb)
0875         err = rq->engine->emit_init_breadcrumb(rq);
0876     if (err == 0)
0877         err = emit_semaphore_chain(rq, vma, idx);
0878     if (err == 0)
0879         i915_request_get(rq);
0880     i915_request_add(rq);
0881     if (err)
0882         rq = ERR_PTR(err);
0883
0884 out_ce:
0885     intel_context_put(ce);
0886     return rq;
0887 }
0888
0889 static int
0890 release_queue(struct intel_engine_cs *engine,
0891           struct i915_vma *vma,
0892           int idx, int prio)
0893 {
0894     struct i915_sched_attr attr = {
0895         .priority = prio,
0896     };
0897     struct i915_request *rq;
0898     u32 *cs;
0899
0900     rq = intel_engine_create_kernel_request(engine);
0901     if (IS_ERR(rq))
0902         return PTR_ERR(rq);
0903
0904     cs = intel_ring_begin(rq, 4);
0905     if (IS_ERR(cs)) {
0906         i915_request_add(rq);
0907         return PTR_ERR(cs);
0908     }
0909
0910     *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
0911     *cs++ = i915_ggtt_offset(vma) + 4 * (idx - 1);
0912     *cs++ = 0;
0913     *cs++ = 1;
0914
0915     intel_ring_advance(rq, cs);
0916
0917     i915_request_get(rq);
0918     i915_request_add(rq);
0919
0920     local_bh_disable();
0921     engine->sched_engine->schedule(rq, &attr);
0922     local_bh_enable(); /* kick tasklet */
0923
0924     i915_request_put(rq);
0925
0926     return 0;
0927 }
0928
0929 static int
0930 slice_semaphore_queue(struct intel_engine_cs *outer,
0931               struct i915_vma *vma,
0932               int count)
0933 {
0934     struct intel_engine_cs *engine;
0935     struct i915_request *head;
0936     enum intel_engine_id id;
0937     int err, i, n = 0;
0938
0939     head = semaphore_queue(outer, vma, n++);
0940     if (IS_ERR(head))
0941         return PTR_ERR(head);
0942
0943     for_each_engine(engine, outer->gt, id) {
0944         if (!intel_engine_has_preemption(engine))
0945             continue;
0946
0947         for (i = 0; i < count; i++) {
0948             struct i915_request *rq;
0949
0950             rq = semaphore_queue(engine, vma, n++);
0951             if (IS_ERR(rq)) {
0952                 err = PTR_ERR(rq);
0953                 goto out;
0954             }
0955
0956             i915_request_put(rq);
0957         }
0958     }
0959
0960     err = release_queue(outer, vma, n, I915_PRIORITY_BARRIER);
0961     if (err)
0962         goto out;
0963
0964     if (i915_request_wait(head, 0,
0965                   2 * outer->gt->info.num_engines * (count + 2) * (count + 3)) < 0) {
0966         pr_err("%s: Failed to slice along semaphore chain of length (%d, %d)!\n",
0967                outer->name, count, n);
0968         GEM_TRACE_DUMP();
0969         intel_gt_set_wedged(outer->gt);
0970         err = -EIO;
0971     }
0972
0973 out:
0974     i915_request_put(head);
0975     return err;
0976 }
0977
0978 static int live_timeslice_preempt(void *arg)
0979 {
0980     struct intel_gt *gt = arg;
0981     struct drm_i915_gem_object *obj;
0982     struct intel_engine_cs *engine;
0983     enum intel_engine_id id;
0984     struct i915_vma *vma;
0985     void *vaddr;
0986     int err = 0;
0987
0988     /*
0989      * If a request takes too long, we would like to give other users
0990      * a fair go on the GPU. In particular, users may create batches
0991      * that wait upon external input, where that input may even be
0992      * supplied by another GPU job. To avoid blocking forever, we
0993      * need to preempt the current task and replace it with another
0994      * ready task.
0995      */
0996     if (!CONFIG_DRM_I915_TIMESLICE_DURATION)
0997         return 0;
0998
0999     obj = i915_gem_object_create_internal(gt->i915, PAGE_SIZE);
1000     if (IS_ERR(obj))
1001         return PTR_ERR(obj);
1002
1003     vma = i915_vma_instance(obj, &gt->ggtt->vm, NULL);
1004     if (IS_ERR(vma)) {
1005         err = PTR_ERR(vma);
1006         goto err_obj;
1007     }
1008
1009     vaddr = i915_gem_object_pin_map_unlocked(obj, I915_MAP_WC);
1010     if (IS_ERR(vaddr)) {
1011         err = PTR_ERR(vaddr);
1012         goto err_obj;
1013     }
1014
1015     err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL);
1016     if (err)
1017         goto err_map;
1018
1019     err = i915_vma_sync(vma);
1020     if (err)
1021         goto err_pin;
1022
1023     for_each_engine(engine, gt, id) {
1024         if (!intel_engine_has_preemption(engine))
1025             continue;
1026
1027         memset(vaddr, 0, PAGE_SIZE);
1028
1029         st_engine_heartbeat_disable(engine);
1030         err = slice_semaphore_queue(engine, vma, 5);
1031         st_engine_heartbeat_enable(engine);
1032         if (err)
1033             goto err_pin;
1034
1035         if (igt_flush_test(gt->i915)) {
1036             err = -EIO;
1037             goto err_pin;
1038         }
1039     }
1040
1041 err_pin:
1042     i915_vma_unpin(vma);
1043 err_map:
1044     i915_gem_object_unpin_map(obj);
1045 err_obj:
1046     i915_gem_object_put(obj);
1047     return err;
1048 }
1049
1050 static struct i915_request *
1051 create_rewinder(struct intel_context *ce,
1052         struct i915_request *wait,
1053         void *slot, int idx)
1054 {
1055     const u32 offset =
1056         i915_ggtt_offset(ce->engine->status_page.vma) +
1057         offset_in_page(slot);
1058     struct i915_request *rq;
1059     u32 *cs;
1060     int err;
1061
1062     rq = intel_context_create_request(ce);
1063     if (IS_ERR(rq))
1064         return rq;
1065
1066     if (wait) {
1067         err = i915_request_await_dma_fence(rq, &wait->fence);
1068         if (err)
1069             goto err;
1070     }
1071
1072     cs = intel_ring_begin(rq, 14);
1073     if (IS_ERR(cs)) {
1074         err = PTR_ERR(cs);
1075         goto err;
1076     }
1077
1078     *cs++ = MI_ARB_ON_OFF | MI_ARB_ENABLE;
1079     *cs++ = MI_NOOP;
1080
1081     *cs++ = MI_SEMAPHORE_WAIT |
1082         MI_SEMAPHORE_GLOBAL_GTT |
1083         MI_SEMAPHORE_POLL |
1084         MI_SEMAPHORE_SAD_GTE_SDD;
1085     *cs++ = idx;
1086     *cs++ = offset;
1087     *cs++ = 0;
1088
1089     *cs++ = MI_STORE_REGISTER_MEM_GEN8 | MI_USE_GGTT;
1090     *cs++ = i915_mmio_reg_offset(RING_TIMESTAMP(rq->engine->mmio_base));
1091     *cs++ = offset + idx * sizeof(u32);
1092     *cs++ = 0;
1093
1094     *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
1095     *cs++ = offset;
1096     *cs++ = 0;
1097     *cs++ = idx + 1;
1098
1099     intel_ring_advance(rq, cs);
1100
1101     err = 0;
1102 err:
1103     i915_request_get(rq);
1104     i915_request_add(rq);
1105     if (err) {
1106         i915_request_put(rq);
1107         return ERR_PTR(err);
1108     }
1109
1110     return rq;
1111 }
1112
1113 static int live_timeslice_rewind(void *arg)
1114 {
1115     struct intel_gt *gt = arg;
1116     struct intel_engine_cs *engine;
1117     enum intel_engine_id id;
1118
1119     /*
1120      * The usual presumption on timeslice expiration is that we replace
1121      * the active context with another. However, given a chain of
1122      * dependencies we may end up with replacing the context with itself,
1123      * but only a few of those requests, forcing us to rewind the
1124      * RING_TAIL of the original request.
1125      */
1126     if (!CONFIG_DRM_I915_TIMESLICE_DURATION)
1127         return 0;
1128
1129     for_each_engine(engine, gt, id) {
1130         enum { A1, A2, B1 };
1131         enum { X = 1, Z, Y };
1132         struct i915_request *rq[3] = {};
1133         struct intel_context *ce;
1134         unsigned long timeslice;
1135         int i, err = 0;
1136         u32 *slot;
1137
1138         if (!intel_engine_has_timeslices(engine))
1139             continue;
1140
1141         /*
1142          * A:rq1 -- semaphore wait, timestamp X
1143          * A:rq2 -- write timestamp Y
1144          *
1145          * B:rq1 [await A:rq1] -- write timestamp Z
1146          *
1147          * Force timeslice, release semaphore.
1148          *
1149          * Expect execution/evaluation order XZY
1150          */
1151
1152         st_engine_heartbeat_disable(engine);
1153         timeslice = xchg(&engine->props.timeslice_duration_ms, 1);
1154
1155         slot = memset32(engine->status_page.addr + 1000, 0, 4);
1156
1157         ce = intel_context_create(engine);
1158         if (IS_ERR(ce)) {
1159             err = PTR_ERR(ce);
1160             goto err;
1161         }
1162
1163         rq[A1] = create_rewinder(ce, NULL, slot, X);
1164         if (IS_ERR(rq[A1])) {
1165             intel_context_put(ce);
1166             goto err;
1167         }
1168
1169         rq[A2] = create_rewinder(ce, NULL, slot, Y);
1170         intel_context_put(ce);
1171         if (IS_ERR(rq[A2]))
1172             goto err;
1173
1174         err = wait_for_submit(engine, rq[A2], HZ / 2);
1175         if (err) {
1176             pr_err("%s: failed to submit first context\n",
1177                    engine->name);
1178             goto err;
1179         }
1180
1181         ce = intel_context_create(engine);
1182         if (IS_ERR(ce)) {
1183             err = PTR_ERR(ce);
1184             goto err;
1185         }
1186
1187         rq[B1] = create_rewinder(ce, rq[A1], slot, Z);
1188         intel_context_put(ce);
1189         if (IS_ERR(rq[2]))
1190             goto err;
1191
1192         err = wait_for_submit(engine, rq[B1], HZ / 2);
1193         if (err) {
1194             pr_err("%s: failed to submit second context\n",
1195                    engine->name);
1196             goto err;
1197         }
1198
1199         /* ELSP[] = { { A:rq1, A:rq2 }, { B:rq1 } } */
1200         ENGINE_TRACE(engine, "forcing tasklet for rewind\n");
1201         while (i915_request_is_active(rq[A2])) { /* semaphore yield! */
1202             /* Wait for the timeslice to kick in */
1203             del_timer(&engine->execlists.timer);
1204             tasklet_hi_schedule(&engine->sched_engine->tasklet);
1205             intel_engine_flush_submission(engine);
1206         }
1207         /* -> ELSP[] = { { A:rq1 }, { B:rq1 } } */
1208         GEM_BUG_ON(!i915_request_is_active(rq[A1]));
1209         GEM_BUG_ON(!i915_request_is_active(rq[B1]));
1210         GEM_BUG_ON(i915_request_is_active(rq[A2]));
1211
1212         /* Release the hounds! */
1213         slot[0] = 1;
1214         wmb(); /* "pairs" with GPU; paranoid kick of internal CPU$ */
1215
1216         for (i = 1; i <= 3; i++) {
1217             unsigned long timeout = jiffies + HZ / 2;
1218
1219             while (!READ_ONCE(slot[i]) &&
1220                    time_before(jiffies, timeout))
1221                 ;
1222
1223             if (!time_before(jiffies, timeout)) {
1224                 pr_err("%s: rq[%d] timed out\n",
1225                        engine->name, i - 1);
1226                 err = -ETIME;
1227                 goto err;
1228             }
1229
1230             pr_debug("%s: slot[%d]:%x\n", engine->name, i, slot[i]);
1231         }
1232
1233         /* XZY: XZ < XY */
1234         if (slot[Z] - slot[X] >= slot[Y] - slot[X]) {
1235             pr_err("%s: timeslicing did not run context B [%u] before A [%u]!\n",
1236                    engine->name,
1237                    slot[Z] - slot[X],
1238                    slot[Y] - slot[X]);
1239             err = -EINVAL;
1240         }
1241
1242 err:
1243         memset32(&slot[0], -1, 4);
1244         wmb();
1245
1246         engine->props.timeslice_duration_ms = timeslice;
1247         st_engine_heartbeat_enable(engine);
1248         for (i = 0; i < 3; i++)
1249             i915_request_put(rq[i]);
1250         if (igt_flush_test(gt->i915))
1251             err = -EIO;
1252         if (err)
1253             return err;
1254     }
1255
1256     return 0;
1257 }
1258
1259 static struct i915_request *nop_request(struct intel_engine_cs *engine)
1260 {
1261     struct i915_request *rq;
1262
1263     rq = intel_engine_create_kernel_request(engine);
1264     if (IS_ERR(rq))
1265         return rq;
1266
1267     i915_request_get(rq);
1268     i915_request_add(rq);
1269
1270     return rq;
1271 }
1272
1273 static long slice_timeout(struct intel_engine_cs *engine)
1274 {
1275     long timeout;
1276
1277     /* Enough time for a timeslice to kick in, and kick out */
1278     timeout = 2 * msecs_to_jiffies_timeout(timeslice(engine));
1279
1280     /* Enough time for the nop request to complete */
1281     timeout += HZ / 5;
1282
1283     return timeout + 1;
1284 }
1285
1286 static int live_timeslice_queue(void *arg)
1287 {
1288     struct intel_gt *gt = arg;
1289     struct drm_i915_gem_object *obj;
1290     struct intel_engine_cs *engine;
1291     enum intel_engine_id id;
1292     struct i915_vma *vma;
1293     void *vaddr;
1294     int err = 0;
1295
1296     /*
1297      * Make sure that even if ELSP[0] and ELSP[1] are filled with
1298      * timeslicing between them disabled, we *do* enable timeslicing
1299      * if the queue demands it. (Normally, we do not submit if
1300      * ELSP[1] is already occupied, so must rely on timeslicing to
1301      * eject ELSP[0] in favour of the queue.)
1302      */
1303     if (!CONFIG_DRM_I915_TIMESLICE_DURATION)
1304         return 0;
1305
1306     obj = i915_gem_object_create_internal(gt->i915, PAGE_SIZE);
1307     if (IS_ERR(obj))
1308         return PTR_ERR(obj);
1309
1310     vma = i915_vma_instance(obj, &gt->ggtt->vm, NULL);
1311     if (IS_ERR(vma)) {
1312         err = PTR_ERR(vma);
1313         goto err_obj;
1314     }
1315
1316     vaddr = i915_gem_object_pin_map_unlocked(obj, I915_MAP_WC);
1317     if (IS_ERR(vaddr)) {
1318         err = PTR_ERR(vaddr);
1319         goto err_obj;
1320     }
1321
1322     err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL);
1323     if (err)
1324         goto err_map;
1325
1326     err = i915_vma_sync(vma);
1327     if (err)
1328         goto err_pin;
1329
1330     for_each_engine(engine, gt, id) {
1331         struct i915_sched_attr attr = { .priority = I915_PRIORITY_MAX };
1332         struct i915_request *rq, *nop;
1333
1334         if (!intel_engine_has_preemption(engine))
1335             continue;
1336
1337         st_engine_heartbeat_disable(engine);
1338         memset(vaddr, 0, PAGE_SIZE);
1339
1340         /* ELSP[0]: semaphore wait */
1341         rq = semaphore_queue(engine, vma, 0);
1342         if (IS_ERR(rq)) {
1343             err = PTR_ERR(rq);
1344             goto err_heartbeat;
1345         }
1346         engine->sched_engine->schedule(rq, &attr);
1347         err = wait_for_submit(engine, rq, HZ / 2);
1348         if (err) {
1349             pr_err("%s: Timed out trying to submit semaphores\n",
1350                    engine->name);
1351             goto err_rq;
1352         }
1353
1354         /* ELSP[1]: nop request */
1355         nop = nop_request(engine);
1356         if (IS_ERR(nop)) {
1357             err = PTR_ERR(nop);
1358             goto err_rq;
1359         }
1360         err = wait_for_submit(engine, nop, HZ / 2);
1361         i915_request_put(nop);
1362         if (err) {
1363             pr_err("%s: Timed out trying to submit nop\n",
1364                    engine->name);
1365             goto err_rq;
1366         }
1367
1368         GEM_BUG_ON(i915_request_completed(rq));
1369         GEM_BUG_ON(execlists_active(&engine->execlists) != rq);
1370
1371         /* Queue: semaphore signal, matching priority as semaphore */
1372         err = release_queue(engine, vma, 1, effective_prio(rq));
1373         if (err)
1374             goto err_rq;
1375
1376         /* Wait until we ack the release_queue and start timeslicing */
1377         do {
1378             cond_resched();
1379             intel_engine_flush_submission(engine);
1380         } while (READ_ONCE(engine->execlists.pending[0]));
1381
1382         /* Timeslice every jiffy, so within 2 we should signal */
1383         if (i915_request_wait(rq, 0, slice_timeout(engine)) < 0) {
1384             struct drm_printer p =
1385                 drm_info_printer(gt->i915->drm.dev);
1386
1387             pr_err("%s: Failed to timeslice into queue\n",
1388                    engine->name);
1389             intel_engine_dump(engine, &p,
1390                       "%s\n", engine->name);
1391
1392             memset(vaddr, 0xff, PAGE_SIZE);
1393             err = -EIO;
1394         }
1395 err_rq:
1396         i915_request_put(rq);
1397 err_heartbeat:
1398         st_engine_heartbeat_enable(engine);
1399         if (err)
1400             break;
1401     }
1402
1403 err_pin:
1404     i915_vma_unpin(vma);
1405 err_map:
1406     i915_gem_object_unpin_map(obj);
1407 err_obj:
1408     i915_gem_object_put(obj);
1409     return err;
1410 }
1411
1412 static int live_timeslice_nopreempt(void *arg)
1413 {
1414     struct intel_gt *gt = arg;
1415     struct intel_engine_cs *engine;
1416     enum intel_engine_id id;
1417     struct igt_spinner spin;
1418     int err = 0;
1419
1420     /*
1421      * We should not timeslice into a request that is marked with
1422      * I915_REQUEST_NOPREEMPT.
1423      */
1424     if (!CONFIG_DRM_I915_TIMESLICE_DURATION)
1425         return 0;
1426
1427     if (igt_spinner_init(&spin, gt))
1428         return -ENOMEM;
1429
1430     for_each_engine(engine, gt, id) {
1431         struct intel_context *ce;
1432         struct i915_request *rq;
1433         unsigned long timeslice;
1434
1435         if (!intel_engine_has_preemption(engine))
1436             continue;
1437
1438         ce = intel_context_create(engine);
1439         if (IS_ERR(ce)) {
1440             err = PTR_ERR(ce);
1441             break;
1442         }
1443
1444         st_engine_heartbeat_disable(engine);
1445         timeslice = xchg(&engine->props.timeslice_duration_ms, 1);
1446
1447         /* Create an unpreemptible spinner */
1448
1449         rq = igt_spinner_create_request(&spin, ce, MI_ARB_CHECK);
1450         intel_context_put(ce);
1451         if (IS_ERR(rq)) {
1452             err = PTR_ERR(rq);
1453             goto out_heartbeat;
1454         }
1455
1456         i915_request_get(rq);
1457         i915_request_add(rq);
1458
1459         if (!igt_wait_for_spinner(&spin, rq)) {
1460             i915_request_put(rq);
1461             err = -ETIME;
1462             goto out_spin;
1463         }
1464
1465         set_bit(I915_FENCE_FLAG_NOPREEMPT, &rq->fence.flags);
1466         i915_request_put(rq);
1467
1468         /* Followed by a maximum priority barrier (heartbeat) */
1469
1470         ce = intel_context_create(engine);
1471         if (IS_ERR(ce)) {
1472             err = PTR_ERR(ce);
1473             goto out_spin;
1474         }
1475
1476         rq = intel_context_create_request(ce);
1477         intel_context_put(ce);
1478         if (IS_ERR(rq)) {
1479             err = PTR_ERR(rq);
1480             goto out_spin;
1481         }
1482
1483         rq->sched.attr.priority = I915_PRIORITY_BARRIER;
1484         i915_request_get(rq);
1485         i915_request_add(rq);
1486
1487         /*
1488          * Wait until the barrier is in ELSP, and we know timeslicing
1489          * will have been activated.
1490          */
1491         if (wait_for_submit(engine, rq, HZ / 2)) {
1492             i915_request_put(rq);
1493             err = -ETIME;
1494             goto out_spin;
1495         }
1496
1497         /*
1498          * Since the ELSP[0] request is unpreemptible, it should not
1499          * allow the maximum priority barrier through. Wait long
1500          * enough to see if it is timesliced in by mistake.
1501          */
1502         if (i915_request_wait(rq, 0, slice_timeout(engine)) >= 0) {
1503             pr_err("%s: I915_PRIORITY_BARRIER request completed, bypassing no-preempt request\n",
1504                    engine->name);
1505             err = -EINVAL;
1506         }
1507         i915_request_put(rq);
1508
1509 out_spin:
1510         igt_spinner_end(&spin);
1511 out_heartbeat:
1512         xchg(&engine->props.timeslice_duration_ms, timeslice);
1513         st_engine_heartbeat_enable(engine);
1514         if (err)
1515             break;
1516
1517         if (igt_flush_test(gt->i915)) {
1518             err = -EIO;
1519             break;
1520         }
1521     }
1522
1523     igt_spinner_fini(&spin);
1524     return err;
1525 }
1526
1527 static int live_busywait_preempt(void *arg)
1528 {
1529     struct intel_gt *gt = arg;
1530     struct i915_gem_context *ctx_hi, *ctx_lo;
1531     struct intel_engine_cs *engine;
1532     struct drm_i915_gem_object *obj;
1533     struct i915_vma *vma;
1534     enum intel_engine_id id;
1535     int err = -ENOMEM;
1536     u32 *map;
1537
1538     /*
1539      * Verify that even without HAS_LOGICAL_RING_PREEMPTION, we can
1540      * preempt the busywaits used to synchronise between rings.
1541      */
1542
1543     ctx_hi = kernel_context(gt->i915, NULL);
1544     if (!ctx_hi)
1545         return -ENOMEM;
1546     ctx_hi->sched.priority = I915_CONTEXT_MAX_USER_PRIORITY;
1547
1548     ctx_lo = kernel_context(gt->i915, NULL);
1549     if (!ctx_lo)
1550         goto err_ctx_hi;
1551     ctx_lo->sched.priority = I915_CONTEXT_MIN_USER_PRIORITY;
1552
1553     obj = i915_gem_object_create_internal(gt->i915, PAGE_SIZE);
1554     if (IS_ERR(obj)) {
1555         err = PTR_ERR(obj);
1556         goto err_ctx_lo;
1557     }
1558
1559     map = i915_gem_object_pin_map_unlocked(obj, I915_MAP_WC);
1560     if (IS_ERR(map)) {
1561         err = PTR_ERR(map);
1562         goto err_obj;
1563     }
1564
1565     vma = i915_vma_instance(obj, &gt->ggtt->vm, NULL);
1566     if (IS_ERR(vma)) {
1567         err = PTR_ERR(vma);
1568         goto err_map;
1569     }
1570
1571     err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL);
1572     if (err)
1573         goto err_map;
1574
1575     err = i915_vma_sync(vma);
1576     if (err)
1577         goto err_vma;
1578
1579     for_each_engine(engine, gt, id) {
1580         struct i915_request *lo, *hi;
1581         struct igt_live_test t;
1582         u32 *cs;
1583
1584         if (!intel_engine_has_preemption(engine))
1585             continue;
1586
1587         if (!intel_engine_can_store_dword(engine))
1588             continue;
1589
1590         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
1591             err = -EIO;
1592             goto err_vma;
1593         }
1594
1595         /*
1596          * We create two requests. The low priority request
1597          * busywaits on a semaphore (inside the ringbuffer where
1598          * is should be preemptible) and the high priority requests
1599          * uses a MI_STORE_DWORD_IMM to update the semaphore value
1600          * allowing the first request to complete. If preemption
1601          * fails, we hang instead.
1602          */
1603
1604         lo = igt_request_alloc(ctx_lo, engine);
1605         if (IS_ERR(lo)) {
1606             err = PTR_ERR(lo);
1607             goto err_vma;
1608         }
1609
1610         cs = intel_ring_begin(lo, 8);
1611         if (IS_ERR(cs)) {
1612             err = PTR_ERR(cs);
1613             i915_request_add(lo);
1614             goto err_vma;
1615         }
1616
1617         *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
1618         *cs++ = i915_ggtt_offset(vma);
1619         *cs++ = 0;
1620         *cs++ = 1;
1621
1622         /* XXX Do we need a flush + invalidate here? */
1623
1624         *cs++ = MI_SEMAPHORE_WAIT |
1625             MI_SEMAPHORE_GLOBAL_GTT |
1626             MI_SEMAPHORE_POLL |
1627             MI_SEMAPHORE_SAD_EQ_SDD;
1628         *cs++ = 0;
1629         *cs++ = i915_ggtt_offset(vma);
1630         *cs++ = 0;
1631
1632         intel_ring_advance(lo, cs);
1633
1634         i915_request_get(lo);
1635         i915_request_add(lo);
1636
1637         if (wait_for(READ_ONCE(*map), 10)) {
1638             i915_request_put(lo);
1639             err = -ETIMEDOUT;
1640             goto err_vma;
1641         }
1642
1643         /* Low priority request should be busywaiting now */
1644         if (i915_request_wait(lo, 0, 1) != -ETIME) {
1645             i915_request_put(lo);
1646             pr_err("%s: Busywaiting request did not!\n",
1647                    engine->name);
1648             err = -EIO;
1649             goto err_vma;
1650         }
1651
1652         hi = igt_request_alloc(ctx_hi, engine);
1653         if (IS_ERR(hi)) {
1654             err = PTR_ERR(hi);
1655             i915_request_put(lo);
1656             goto err_vma;
1657         }
1658
1659         cs = intel_ring_begin(hi, 4);
1660         if (IS_ERR(cs)) {
1661             err = PTR_ERR(cs);
1662             i915_request_add(hi);
1663             i915_request_put(lo);
1664             goto err_vma;
1665         }
1666
1667         *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
1668         *cs++ = i915_ggtt_offset(vma);
1669         *cs++ = 0;
1670         *cs++ = 0;
1671
1672         intel_ring_advance(hi, cs);
1673         i915_request_add(hi);
1674
1675         if (i915_request_wait(lo, 0, HZ / 5) < 0) {
1676             struct drm_printer p = drm_info_printer(gt->i915->drm.dev);
1677
1678             pr_err("%s: Failed to preempt semaphore busywait!\n",
1679                    engine->name);
1680
1681             intel_engine_dump(engine, &p, "%s\n", engine->name);
1682             GEM_TRACE_DUMP();
1683
1684             i915_request_put(lo);
1685             intel_gt_set_wedged(gt);
1686             err = -EIO;
1687             goto err_vma;
1688         }
1689         GEM_BUG_ON(READ_ONCE(*map));
1690         i915_request_put(lo);
1691
1692         if (igt_live_test_end(&t)) {
1693             err = -EIO;
1694             goto err_vma;
1695         }
1696     }
1697
1698     err = 0;
1699 err_vma:
1700     i915_vma_unpin(vma);
1701 err_map:
1702     i915_gem_object_unpin_map(obj);
1703 err_obj:
1704     i915_gem_object_put(obj);
1705 err_ctx_lo:
1706     kernel_context_close(ctx_lo);
1707 err_ctx_hi:
1708     kernel_context_close(ctx_hi);
1709     return err;
1710 }
1711
1712 static struct i915_request *
1713 spinner_create_request(struct igt_spinner *spin,
1714                struct i915_gem_context *ctx,
1715                struct intel_engine_cs *engine,
1716                u32 arb)
1717 {
1718     struct intel_context *ce;
1719     struct i915_request *rq;
1720
1721     ce = i915_gem_context_get_engine(ctx, engine->legacy_idx);
1722     if (IS_ERR(ce))
1723         return ERR_CAST(ce);
1724
1725     rq = igt_spinner_create_request(spin, ce, arb);
1726     intel_context_put(ce);
1727     return rq;
1728 }
1729
1730 static int live_preempt(void *arg)
1731 {
1732     struct intel_gt *gt = arg;
1733     struct i915_gem_context *ctx_hi, *ctx_lo;
1734     struct igt_spinner spin_hi, spin_lo;
1735     struct intel_engine_cs *engine;
1736     enum intel_engine_id id;
1737     int err = -ENOMEM;
1738
1739     ctx_hi = kernel_context(gt->i915, NULL);
1740     if (!ctx_hi)
1741         return -ENOMEM;
1742     ctx_hi->sched.priority = I915_CONTEXT_MAX_USER_PRIORITY;
1743
1744     ctx_lo = kernel_context(gt->i915, NULL);
1745     if (!ctx_lo)
1746         goto err_ctx_hi;
1747     ctx_lo->sched.priority = I915_CONTEXT_MIN_USER_PRIORITY;
1748
1749     if (igt_spinner_init(&spin_hi, gt))
1750         goto err_ctx_lo;
1751
1752     if (igt_spinner_init(&spin_lo, gt))
1753         goto err_spin_hi;
1754
1755     for_each_engine(engine, gt, id) {
1756         struct igt_live_test t;
1757         struct i915_request *rq;
1758
1759         if (!intel_engine_has_preemption(engine))
1760             continue;
1761
1762         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
1763             err = -EIO;
1764             goto err_spin_lo;
1765         }
1766
1767         rq = spinner_create_request(&spin_lo, ctx_lo, engine,
1768                         MI_ARB_CHECK);
1769         if (IS_ERR(rq)) {
1770             err = PTR_ERR(rq);
1771             goto err_spin_lo;
1772         }
1773
1774         i915_request_add(rq);
1775         if (!igt_wait_for_spinner(&spin_lo, rq)) {
1776             GEM_TRACE("lo spinner failed to start\n");
1777             GEM_TRACE_DUMP();
1778             intel_gt_set_wedged(gt);
1779             err = -EIO;
1780             goto err_spin_lo;
1781         }
1782
1783         rq = spinner_create_request(&spin_hi, ctx_hi, engine,
1784                         MI_ARB_CHECK);
1785         if (IS_ERR(rq)) {
1786             igt_spinner_end(&spin_lo);
1787             err = PTR_ERR(rq);
1788             goto err_spin_lo;
1789         }
1790
1791         i915_request_add(rq);
1792         if (!igt_wait_for_spinner(&spin_hi, rq)) {
1793             GEM_TRACE("hi spinner failed to start\n");
1794             GEM_TRACE_DUMP();
1795             intel_gt_set_wedged(gt);
1796             err = -EIO;
1797             goto err_spin_lo;
1798         }
1799
1800         igt_spinner_end(&spin_hi);
1801         igt_spinner_end(&spin_lo);
1802
1803         if (igt_live_test_end(&t)) {
1804             err = -EIO;
1805             goto err_spin_lo;
1806         }
1807     }
1808
1809     err = 0;
1810 err_spin_lo:
1811     igt_spinner_fini(&spin_lo);
1812 err_spin_hi:
1813     igt_spinner_fini(&spin_hi);
1814 err_ctx_lo:
1815     kernel_context_close(ctx_lo);
1816 err_ctx_hi:
1817     kernel_context_close(ctx_hi);
1818     return err;
1819 }
1820
1821 static int live_late_preempt(void *arg)
1822 {
1823     struct intel_gt *gt = arg;
1824     struct i915_gem_context *ctx_hi, *ctx_lo;
1825     struct igt_spinner spin_hi, spin_lo;
1826     struct intel_engine_cs *engine;
1827     struct i915_sched_attr attr = {};
1828     enum intel_engine_id id;
1829     int err = -ENOMEM;
1830
1831     ctx_hi = kernel_context(gt->i915, NULL);
1832     if (!ctx_hi)
1833         return -ENOMEM;
1834
1835     ctx_lo = kernel_context(gt->i915, NULL);
1836     if (!ctx_lo)
1837         goto err_ctx_hi;
1838
1839     if (igt_spinner_init(&spin_hi, gt))
1840         goto err_ctx_lo;
1841
1842     if (igt_spinner_init(&spin_lo, gt))
1843         goto err_spin_hi;
1844
1845     /* Make sure ctx_lo stays before ctx_hi until we trigger preemption. */
1846     ctx_lo->sched.priority = 1;
1847
1848     for_each_engine(engine, gt, id) {
1849         struct igt_live_test t;
1850         struct i915_request *rq;
1851
1852         if (!intel_engine_has_preemption(engine))
1853             continue;
1854
1855         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
1856             err = -EIO;
1857             goto err_spin_lo;
1858         }
1859
1860         rq = spinner_create_request(&spin_lo, ctx_lo, engine,
1861                         MI_ARB_CHECK);
1862         if (IS_ERR(rq)) {
1863             err = PTR_ERR(rq);
1864             goto err_spin_lo;
1865         }
1866
1867         i915_request_add(rq);
1868         if (!igt_wait_for_spinner(&spin_lo, rq)) {
1869             pr_err("First context failed to start\n");
1870             goto err_wedged;
1871         }
1872
1873         rq = spinner_create_request(&spin_hi, ctx_hi, engine,
1874                         MI_NOOP);
1875         if (IS_ERR(rq)) {
1876             igt_spinner_end(&spin_lo);
1877             err = PTR_ERR(rq);
1878             goto err_spin_lo;
1879         }
1880
1881         i915_request_add(rq);
1882         if (igt_wait_for_spinner(&spin_hi, rq)) {
1883             pr_err("Second context overtook first?\n");
1884             goto err_wedged;
1885         }
1886
1887         attr.priority = I915_PRIORITY_MAX;
1888         engine->sched_engine->schedule(rq, &attr);
1889
1890         if (!igt_wait_for_spinner(&spin_hi, rq)) {
1891             pr_err("High priority context failed to preempt the low priority context\n");
1892             GEM_TRACE_DUMP();
1893             goto err_wedged;
1894         }
1895
1896         igt_spinner_end(&spin_hi);
1897         igt_spinner_end(&spin_lo);
1898
1899         if (igt_live_test_end(&t)) {
1900             err = -EIO;
1901             goto err_spin_lo;
1902         }
1903     }
1904
1905     err = 0;
1906 err_spin_lo:
1907     igt_spinner_fini(&spin_lo);
1908 err_spin_hi:
1909     igt_spinner_fini(&spin_hi);
1910 err_ctx_lo:
1911     kernel_context_close(ctx_lo);
1912 err_ctx_hi:
1913     kernel_context_close(ctx_hi);
1914     return err;
1915
1916 err_wedged:
1917     igt_spinner_end(&spin_hi);
1918     igt_spinner_end(&spin_lo);
1919     intel_gt_set_wedged(gt);
1920     err = -EIO;
1921     goto err_spin_lo;
1922 }
1923
1924 struct preempt_client {
1925     struct igt_spinner spin;
1926     struct i915_gem_context *ctx;
1927 };
1928
1929 static int preempt_client_init(struct intel_gt *gt, struct preempt_client *c)
1930 {
1931     c->ctx = kernel_context(gt->i915, NULL);
1932     if (!c->ctx)
1933         return -ENOMEM;
1934
1935     if (igt_spinner_init(&c->spin, gt))
1936         goto err_ctx;
1937
1938     return 0;
1939
1940 err_ctx:
1941     kernel_context_close(c->ctx);
1942     return -ENOMEM;
1943 }
1944
1945 static void preempt_client_fini(struct preempt_client *c)
1946 {
1947     igt_spinner_fini(&c->spin);
1948     kernel_context_close(c->ctx);
1949 }
1950
1951 static int live_nopreempt(void *arg)
1952 {
1953     struct intel_gt *gt = arg;
1954     struct intel_engine_cs *engine;
1955     struct preempt_client a, b;
1956     enum intel_engine_id id;
1957     int err = -ENOMEM;
1958
1959     /*
1960      * Verify that we can disable preemption for an individual request
1961      * that may be being observed and not want to be interrupted.
1962      */
1963
1964     if (preempt_client_init(gt, &a))
1965         return -ENOMEM;
1966     if (preempt_client_init(gt, &b))
1967         goto err_client_a;
1968     b.ctx->sched.priority = I915_PRIORITY_MAX;
1969
1970     for_each_engine(engine, gt, id) {
1971         struct i915_request *rq_a, *rq_b;
1972
1973         if (!intel_engine_has_preemption(engine))
1974             continue;
1975
1976         engine->execlists.preempt_hang.count = 0;
1977
1978         rq_a = spinner_create_request(&a.spin,
1979                           a.ctx, engine,
1980                           MI_ARB_CHECK);
1981         if (IS_ERR(rq_a)) {
1982             err = PTR_ERR(rq_a);
1983             goto err_client_b;
1984         }
1985
1986         /* Low priority client, but unpreemptable! */
1987         __set_bit(I915_FENCE_FLAG_NOPREEMPT, &rq_a->fence.flags);
1988
1989         i915_request_add(rq_a);
1990         if (!igt_wait_for_spinner(&a.spin, rq_a)) {
1991             pr_err("First client failed to start\n");
1992             goto err_wedged;
1993         }
1994
1995         rq_b = spinner_create_request(&b.spin,
1996                           b.ctx, engine,
1997                           MI_ARB_CHECK);
1998         if (IS_ERR(rq_b)) {
1999             err = PTR_ERR(rq_b);
2000             goto err_client_b;
2001         }
2002
2003         i915_request_add(rq_b);
2004
2005         /* B is much more important than A! (But A is unpreemptable.) */
2006         GEM_BUG_ON(rq_prio(rq_b) <= rq_prio(rq_a));
2007
2008         /* Wait long enough for preemption and timeslicing */
2009         if (igt_wait_for_spinner(&b.spin, rq_b)) {
2010             pr_err("Second client started too early!\n");
2011             goto err_wedged;
2012         }
2013
2014         igt_spinner_end(&a.spin);
2015
2016         if (!igt_wait_for_spinner(&b.spin, rq_b)) {
2017             pr_err("Second client failed to start\n");
2018             goto err_wedged;
2019         }
2020
2021         igt_spinner_end(&b.spin);
2022
2023         if (engine->execlists.preempt_hang.count) {
2024             pr_err("Preemption recorded x%d; should have been suppressed!\n",
2025                    engine->execlists.preempt_hang.count);
2026             err = -EINVAL;
2027             goto err_wedged;
2028         }
2029
2030         if (igt_flush_test(gt->i915))
2031             goto err_wedged;
2032     }
2033
2034     err = 0;
2035 err_client_b:
2036     preempt_client_fini(&b);
2037 err_client_a:
2038     preempt_client_fini(&a);
2039     return err;
2040
2041 err_wedged:
2042     igt_spinner_end(&b.spin);
2043     igt_spinner_end(&a.spin);
2044     intel_gt_set_wedged(gt);
2045     err = -EIO;
2046     goto err_client_b;
2047 }
2048
2049 struct live_preempt_cancel {
2050     struct intel_engine_cs *engine;
2051     struct preempt_client a, b;
2052 };
2053
2054 static int __cancel_active0(struct live_preempt_cancel *arg)
2055 {
2056     struct i915_request *rq;
2057     struct igt_live_test t;
2058     int err;
2059
2060     /* Preempt cancel of ELSP0 */
2061     GEM_TRACE("%s(%s)\n", __func__, arg->engine->name);
2062     if (igt_live_test_begin(&t, arg->engine->i915,
2063                 __func__, arg->engine->name))
2064         return -EIO;
2065
2066     rq = spinner_create_request(&arg->a.spin,
2067                     arg->a.ctx, arg->engine,
2068                     MI_ARB_CHECK);
2069     if (IS_ERR(rq))
2070         return PTR_ERR(rq);
2071
2072     clear_bit(CONTEXT_BANNED, &rq->context->flags);
2073     i915_request_get(rq);
2074     i915_request_add(rq);
2075     if (!igt_wait_for_spinner(&arg->a.spin, rq)) {
2076         err = -EIO;
2077         goto out;
2078     }
2079
2080     intel_context_set_banned(rq->context);
2081     err = intel_engine_pulse(arg->engine);
2082     if (err)
2083         goto out;
2084
2085     err = wait_for_reset(arg->engine, rq, HZ / 2);
2086     if (err) {
2087         pr_err("Cancelled inflight0 request did not reset\n");
2088         goto out;
2089     }
2090
2091 out:
2092     i915_request_put(rq);
2093     if (igt_live_test_end(&t))
2094         err = -EIO;
2095     return err;
2096 }
2097
2098 static int __cancel_active1(struct live_preempt_cancel *arg)
2099 {
2100     struct i915_request *rq[2] = {};
2101     struct igt_live_test t;
2102     int err;
2103
2104     /* Preempt cancel of ELSP1 */
2105     GEM_TRACE("%s(%s)\n", __func__, arg->engine->name);
2106     if (igt_live_test_begin(&t, arg->engine->i915,
2107                 __func__, arg->engine->name))
2108         return -EIO;
2109
2110     rq[0] = spinner_create_request(&arg->a.spin,
2111                        arg->a.ctx, arg->engine,
2112                        MI_NOOP); /* no preemption */
2113     if (IS_ERR(rq[0]))
2114         return PTR_ERR(rq[0]);
2115
2116     clear_bit(CONTEXT_BANNED, &rq[0]->context->flags);
2117     i915_request_get(rq[0]);
2118     i915_request_add(rq[0]);
2119     if (!igt_wait_for_spinner(&arg->a.spin, rq[0])) {
2120         err = -EIO;
2121         goto out;
2122     }
2123
2124     rq[1] = spinner_create_request(&arg->b.spin,
2125                        arg->b.ctx, arg->engine,
2126                        MI_ARB_CHECK);
2127     if (IS_ERR(rq[1])) {
2128         err = PTR_ERR(rq[1]);
2129         goto out;
2130     }
2131
2132     clear_bit(CONTEXT_BANNED, &rq[1]->context->flags);
2133     i915_request_get(rq[1]);
2134     err = i915_request_await_dma_fence(rq[1], &rq[0]->fence);
2135     i915_request_add(rq[1]);
2136     if (err)
2137         goto out;
2138
2139     intel_context_set_banned(rq[1]->context);
2140     err = intel_engine_pulse(arg->engine);
2141     if (err)
2142         goto out;
2143
2144     igt_spinner_end(&arg->a.spin);
2145     err = wait_for_reset(arg->engine, rq[1], HZ / 2);
2146     if (err)
2147         goto out;
2148
2149     if (rq[0]->fence.error != 0) {
2150         pr_err("Normal inflight0 request did not complete\n");
2151         err = -EINVAL;
2152         goto out;
2153     }
2154
2155     if (rq[1]->fence.error != -EIO) {
2156         pr_err("Cancelled inflight1 request did not report -EIO\n");
2157         err = -EINVAL;
2158         goto out;
2159     }
2160
2161 out:
2162     i915_request_put(rq[1]);
2163     i915_request_put(rq[0]);
2164     if (igt_live_test_end(&t))
2165         err = -EIO;
2166     return err;
2167 }
2168
2169 static int __cancel_queued(struct live_preempt_cancel *arg)
2170 {
2171     struct i915_request *rq[3] = {};
2172     struct igt_live_test t;
2173     int err;
2174
2175     /* Full ELSP and one in the wings */
2176     GEM_TRACE("%s(%s)\n", __func__, arg->engine->name);
2177     if (igt_live_test_begin(&t, arg->engine->i915,
2178                 __func__, arg->engine->name))
2179         return -EIO;
2180
2181     rq[0] = spinner_create_request(&arg->a.spin,
2182                        arg->a.ctx, arg->engine,
2183                        MI_ARB_CHECK);
2184     if (IS_ERR(rq[0]))
2185         return PTR_ERR(rq[0]);
2186
2187     clear_bit(CONTEXT_BANNED, &rq[0]->context->flags);
2188     i915_request_get(rq[0]);
2189     i915_request_add(rq[0]);
2190     if (!igt_wait_for_spinner(&arg->a.spin, rq[0])) {
2191         err = -EIO;
2192         goto out;
2193     }
2194
2195     rq[1] = igt_request_alloc(arg->b.ctx, arg->engine);
2196     if (IS_ERR(rq[1])) {
2197         err = PTR_ERR(rq[1]);
2198         goto out;
2199     }
2200
2201     clear_bit(CONTEXT_BANNED, &rq[1]->context->flags);
2202     i915_request_get(rq[1]);
2203     err = i915_request_await_dma_fence(rq[1], &rq[0]->fence);
2204     i915_request_add(rq[1]);
2205     if (err)
2206         goto out;
2207
2208     rq[2] = spinner_create_request(&arg->b.spin,
2209                        arg->a.ctx, arg->engine,
2210                        MI_ARB_CHECK);
2211     if (IS_ERR(rq[2])) {
2212         err = PTR_ERR(rq[2]);
2213         goto out;
2214     }
2215
2216     i915_request_get(rq[2]);
2217     err = i915_request_await_dma_fence(rq[2], &rq[1]->fence);
2218     i915_request_add(rq[2]);
2219     if (err)
2220         goto out;
2221
2222     intel_context_set_banned(rq[2]->context);
2223     err = intel_engine_pulse(arg->engine);
2224     if (err)
2225         goto out;
2226
2227     err = wait_for_reset(arg->engine, rq[2], HZ / 2);
2228     if (err)
2229         goto out;
2230
2231     if (rq[0]->fence.error != -EIO) {
2232         pr_err("Cancelled inflight0 request did not report -EIO\n");
2233         err = -EINVAL;
2234         goto out;
2235     }
2236
2237     if (rq[1]->fence.error != 0) {
2238         pr_err("Normal inflight1 request did not complete\n");
2239         err = -EINVAL;
2240         goto out;
2241     }
2242
2243     if (rq[2]->fence.error != -EIO) {
2244         pr_err("Cancelled queued request did not report -EIO\n");
2245         err = -EINVAL;
2246         goto out;
2247     }
2248
2249 out:
2250     i915_request_put(rq[2]);
2251     i915_request_put(rq[1]);
2252     i915_request_put(rq[0]);
2253     if (igt_live_test_end(&t))
2254         err = -EIO;
2255     return err;
2256 }
2257
2258 static int __cancel_hostile(struct live_preempt_cancel *arg)
2259 {
2260     struct i915_request *rq;
2261     int err;
2262
2263     /* Preempt cancel non-preemptible spinner in ELSP0 */
2264     if (!CONFIG_DRM_I915_PREEMPT_TIMEOUT)
2265         return 0;
2266
2267     if (!intel_has_reset_engine(arg->engine->gt))
2268         return 0;
2269
2270     GEM_TRACE("%s(%s)\n", __func__, arg->engine->name);
2271     rq = spinner_create_request(&arg->a.spin,
2272                     arg->a.ctx, arg->engine,
2273                     MI_NOOP); /* preemption disabled */
2274     if (IS_ERR(rq))
2275         return PTR_ERR(rq);
2276
2277     clear_bit(CONTEXT_BANNED, &rq->context->flags);
2278     i915_request_get(rq);
2279     i915_request_add(rq);
2280     if (!igt_wait_for_spinner(&arg->a.spin, rq)) {
2281         err = -EIO;
2282         goto out;
2283     }
2284
2285     intel_context_set_banned(rq->context);
2286     err = intel_engine_pulse(arg->engine); /* force reset */
2287     if (err)
2288         goto out;
2289
2290     err = wait_for_reset(arg->engine, rq, HZ / 2);
2291     if (err) {
2292         pr_err("Cancelled inflight0 request did not reset\n");
2293         goto out;
2294     }
2295
2296 out:
2297     i915_request_put(rq);
2298     if (igt_flush_test(arg->engine->i915))
2299         err = -EIO;
2300     return err;
2301 }
2302
2303 static void force_reset_timeout(struct intel_engine_cs *engine)
2304 {
2305     engine->reset_timeout.probability = 999;
2306     atomic_set(&engine->reset_timeout.times, -1);
2307 }
2308
2309 static void cancel_reset_timeout(struct intel_engine_cs *engine)
2310 {
2311     memset(&engine->reset_timeout, 0, sizeof(engine->reset_timeout));
2312 }
2313
2314 static int __cancel_fail(struct live_preempt_cancel *arg)
2315 {
2316     struct intel_engine_cs *engine = arg->engine;
2317     struct i915_request *rq;
2318     int err;
2319
2320     if (!CONFIG_DRM_I915_PREEMPT_TIMEOUT)
2321         return 0;
2322
2323     if (!intel_has_reset_engine(engine->gt))
2324         return 0;
2325
2326     GEM_TRACE("%s(%s)\n", __func__, engine->name);
2327     rq = spinner_create_request(&arg->a.spin,
2328                     arg->a.ctx, engine,
2329                     MI_NOOP); /* preemption disabled */
2330     if (IS_ERR(rq))
2331         return PTR_ERR(rq);
2332
2333     clear_bit(CONTEXT_BANNED, &rq->context->flags);
2334     i915_request_get(rq);
2335     i915_request_add(rq);
2336     if (!igt_wait_for_spinner(&arg->a.spin, rq)) {
2337         err = -EIO;
2338         goto out;
2339     }
2340
2341     intel_context_set_banned(rq->context);
2342
2343     err = intel_engine_pulse(engine);
2344     if (err)
2345         goto out;
2346
2347     force_reset_timeout(engine);
2348
2349     /* force preempt reset [failure] */
2350     while (!engine->execlists.pending[0])
2351         intel_engine_flush_submission(engine);
2352     del_timer_sync(&engine->execlists.preempt);
2353     intel_engine_flush_submission(engine);
2354
2355     cancel_reset_timeout(engine);
2356
2357     /* after failure, require heartbeats to reset device */
2358     intel_engine_set_heartbeat(engine, 1);
2359     err = wait_for_reset(engine, rq, HZ / 2);
2360     intel_engine_set_heartbeat(engine,
2361                    engine->defaults.heartbeat_interval_ms);
2362     if (err) {
2363         pr_err("Cancelled inflight0 request did not reset\n");
2364         goto out;
2365     }
2366
2367 out:
2368     i915_request_put(rq);
2369     if (igt_flush_test(engine->i915))
2370         err = -EIO;
2371     return err;
2372 }
2373
2374 static int live_preempt_cancel(void *arg)
2375 {
2376     struct intel_gt *gt = arg;
2377     struct live_preempt_cancel data;
2378     enum intel_engine_id id;
2379     int err = -ENOMEM;
2380
2381     /*
2382      * To cancel an inflight context, we need to first remove it from the
2383      * GPU. That sounds like preemption! Plus a little bit of bookkeeping.
2384      */
2385
2386     if (preempt_client_init(gt, &data.a))
2387         return -ENOMEM;
2388     if (preempt_client_init(gt, &data.b))
2389         goto err_client_a;
2390
2391     for_each_engine(data.engine, gt, id) {
2392         if (!intel_engine_has_preemption(data.engine))
2393             continue;
2394
2395         err = __cancel_active0(&data);
2396         if (err)
2397             goto err_wedged;
2398
2399         err = __cancel_active1(&data);
2400         if (err)
2401             goto err_wedged;
2402
2403         err = __cancel_queued(&data);
2404         if (err)
2405             goto err_wedged;
2406
2407         err = __cancel_hostile(&data);
2408         if (err)
2409             goto err_wedged;
2410
2411         err = __cancel_fail(&data);
2412         if (err)
2413             goto err_wedged;
2414     }
2415
2416     err = 0;
2417 err_client_b:
2418     preempt_client_fini(&data.b);
2419 err_client_a:
2420     preempt_client_fini(&data.a);
2421     return err;
2422
2423 err_wedged:
2424     GEM_TRACE_DUMP();
2425     igt_spinner_end(&data.b.spin);
2426     igt_spinner_end(&data.a.spin);
2427     intel_gt_set_wedged(gt);
2428     goto err_client_b;
2429 }
2430
2431 static int live_suppress_self_preempt(void *arg)
2432 {
2433     struct i915_sched_attr attr = { .priority = I915_PRIORITY_MAX };
2434     struct intel_gt *gt = arg;
2435     struct intel_engine_cs *engine;
2436     struct preempt_client a, b;
2437     enum intel_engine_id id;
2438     int err = -ENOMEM;
2439
2440     /*
2441      * Verify that if a preemption request does not cause a change in
2442      * the current execution order, the preempt-to-idle injection is
2443      * skipped and that we do not accidentally apply it after the CS
2444      * completion event.
2445      */
2446
2447     if (intel_uc_uses_guc_submission(&gt->uc))
2448         return 0; /* presume black blox */
2449
2450     if (intel_vgpu_active(gt->i915))
2451         return 0; /* GVT forces single port & request submission */
2452
2453     if (preempt_client_init(gt, &a))
2454         return -ENOMEM;
2455     if (preempt_client_init(gt, &b))
2456         goto err_client_a;
2457
2458     for_each_engine(engine, gt, id) {
2459         struct i915_request *rq_a, *rq_b;
2460         int depth;
2461
2462         if (!intel_engine_has_preemption(engine))
2463             continue;
2464
2465         if (igt_flush_test(gt->i915))
2466             goto err_wedged;
2467
2468         st_engine_heartbeat_disable(engine);
2469         engine->execlists.preempt_hang.count = 0;
2470
2471         rq_a = spinner_create_request(&a.spin,
2472                           a.ctx, engine,
2473                           MI_NOOP);
2474         if (IS_ERR(rq_a)) {
2475             err = PTR_ERR(rq_a);
2476             st_engine_heartbeat_enable(engine);
2477             goto err_client_b;
2478         }
2479
2480         i915_request_add(rq_a);
2481         if (!igt_wait_for_spinner(&a.spin, rq_a)) {
2482             pr_err("First client failed to start\n");
2483             st_engine_heartbeat_enable(engine);
2484             goto err_wedged;
2485         }
2486
2487         /* Keep postponing the timer to avoid premature slicing */
2488         mod_timer(&engine->execlists.timer, jiffies + HZ);
2489         for (depth = 0; depth < 8; depth++) {
2490             rq_b = spinner_create_request(&b.spin,
2491                               b.ctx, engine,
2492                               MI_NOOP);
2493             if (IS_ERR(rq_b)) {
2494                 err = PTR_ERR(rq_b);
2495                 st_engine_heartbeat_enable(engine);
2496                 goto err_client_b;
2497             }
2498             i915_request_add(rq_b);
2499
2500             GEM_BUG_ON(i915_request_completed(rq_a));
2501             engine->sched_engine->schedule(rq_a, &attr);
2502             igt_spinner_end(&a.spin);
2503
2504             if (!igt_wait_for_spinner(&b.spin, rq_b)) {
2505                 pr_err("Second client failed to start\n");
2506                 st_engine_heartbeat_enable(engine);
2507                 goto err_wedged;
2508             }
2509
2510             swap(a, b);
2511             rq_a = rq_b;
2512         }
2513         igt_spinner_end(&a.spin);
2514
2515         if (engine->execlists.preempt_hang.count) {
2516             pr_err("Preemption on %s recorded x%d, depth %d; should have been suppressed!\n",
2517                    engine->name,
2518                    engine->execlists.preempt_hang.count,
2519                    depth);
2520             st_engine_heartbeat_enable(engine);
2521             err = -EINVAL;
2522             goto err_client_b;
2523         }
2524
2525         st_engine_heartbeat_enable(engine);
2526         if (igt_flush_test(gt->i915))
2527             goto err_wedged;
2528     }
2529
2530     err = 0;
2531 err_client_b:
2532     preempt_client_fini(&b);
2533 err_client_a:
2534     preempt_client_fini(&a);
2535     return err;
2536
2537 err_wedged:
2538     igt_spinner_end(&b.spin);
2539     igt_spinner_end(&a.spin);
2540     intel_gt_set_wedged(gt);
2541     err = -EIO;
2542     goto err_client_b;
2543 }
2544
2545 static int live_chain_preempt(void *arg)
2546 {
2547     struct intel_gt *gt = arg;
2548     struct intel_engine_cs *engine;
2549     struct preempt_client hi, lo;
2550     enum intel_engine_id id;
2551     int err = -ENOMEM;
2552
2553     /*
2554      * Build a chain AB...BA between two contexts (A, B) and request
2555      * preemption of the last request. It should then complete before
2556      * the previously submitted spinner in B.
2557      */
2558
2559     if (preempt_client_init(gt, &hi))
2560         return -ENOMEM;
2561
2562     if (preempt_client_init(gt, &lo))
2563         goto err_client_hi;
2564
2565     for_each_engine(engine, gt, id) {
2566         struct i915_sched_attr attr = { .priority = I915_PRIORITY_MAX };
2567         struct igt_live_test t;
2568         struct i915_request *rq;
2569         int ring_size, count, i;
2570
2571         if (!intel_engine_has_preemption(engine))
2572             continue;
2573
2574         rq = spinner_create_request(&lo.spin,
2575                         lo.ctx, engine,
2576                         MI_ARB_CHECK);
2577         if (IS_ERR(rq))
2578             goto err_wedged;
2579
2580         i915_request_get(rq);
2581         i915_request_add(rq);
2582
2583         ring_size = rq->wa_tail - rq->head;
2584         if (ring_size < 0)
2585             ring_size += rq->ring->size;
2586         ring_size = rq->ring->size / ring_size;
2587         pr_debug("%s(%s): Using maximum of %d requests\n",
2588              __func__, engine->name, ring_size);
2589
2590         igt_spinner_end(&lo.spin);
2591         if (i915_request_wait(rq, 0, HZ / 2) < 0) {
2592             pr_err("Timed out waiting to flush %s\n", engine->name);
2593             i915_request_put(rq);
2594             goto err_wedged;
2595         }
2596         i915_request_put(rq);
2597
2598         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
2599             err = -EIO;
2600             goto err_wedged;
2601         }
2602
2603         for_each_prime_number_from(count, 1, ring_size) {
2604             rq = spinner_create_request(&hi.spin,
2605                             hi.ctx, engine,
2606                             MI_ARB_CHECK);
2607             if (IS_ERR(rq))
2608                 goto err_wedged;
2609             i915_request_add(rq);
2610             if (!igt_wait_for_spinner(&hi.spin, rq))
2611                 goto err_wedged;
2612
2613             rq = spinner_create_request(&lo.spin,
2614                             lo.ctx, engine,
2615                             MI_ARB_CHECK);
2616             if (IS_ERR(rq))
2617                 goto err_wedged;
2618             i915_request_add(rq);
2619
2620             for (i = 0; i < count; i++) {
2621                 rq = igt_request_alloc(lo.ctx, engine);
2622                 if (IS_ERR(rq))
2623                     goto err_wedged;
2624                 i915_request_add(rq);
2625             }
2626
2627             rq = igt_request_alloc(hi.ctx, engine);
2628             if (IS_ERR(rq))
2629                 goto err_wedged;
2630
2631             i915_request_get(rq);
2632             i915_request_add(rq);
2633             engine->sched_engine->schedule(rq, &attr);
2634
2635             igt_spinner_end(&hi.spin);
2636             if (i915_request_wait(rq, 0, HZ / 5) < 0) {
2637                 struct drm_printer p =
2638                     drm_info_printer(gt->i915->drm.dev);
2639
2640                 pr_err("Failed to preempt over chain of %d\n",
2641                        count);
2642                 intel_engine_dump(engine, &p,
2643                           "%s\n", engine->name);
2644                 i915_request_put(rq);
2645                 goto err_wedged;
2646             }
2647             igt_spinner_end(&lo.spin);
2648             i915_request_put(rq);
2649
2650             rq = igt_request_alloc(lo.ctx, engine);
2651             if (IS_ERR(rq))
2652                 goto err_wedged;
2653
2654             i915_request_get(rq);
2655             i915_request_add(rq);
2656
2657             if (i915_request_wait(rq, 0, HZ / 5) < 0) {
2658                 struct drm_printer p =
2659                     drm_info_printer(gt->i915->drm.dev);
2660
2661                 pr_err("Failed to flush low priority chain of %d requests\n",
2662                        count);
2663                 intel_engine_dump(engine, &p,
2664                           "%s\n", engine->name);
2665
2666                 i915_request_put(rq);
2667                 goto err_wedged;
2668             }
2669             i915_request_put(rq);
2670         }
2671
2672         if (igt_live_test_end(&t)) {
2673             err = -EIO;
2674             goto err_wedged;
2675         }
2676     }
2677
2678     err = 0;
2679 err_client_lo:
2680     preempt_client_fini(&lo);
2681 err_client_hi:
2682     preempt_client_fini(&hi);
2683     return err;
2684
2685 err_wedged:
2686     igt_spinner_end(&hi.spin);
2687     igt_spinner_end(&lo.spin);
2688     intel_gt_set_wedged(gt);
2689     err = -EIO;
2690     goto err_client_lo;
2691 }
2692
2693 static int create_gang(struct intel_engine_cs *engine,
2694                struct i915_request **prev)
2695 {
2696     struct drm_i915_gem_object *obj;
2697     struct intel_context *ce;
2698     struct i915_request *rq;
2699     struct i915_vma *vma;
2700     u32 *cs;
2701     int err;
2702
2703     ce = intel_context_create(engine);
2704     if (IS_ERR(ce))
2705         return PTR_ERR(ce);
2706
2707     obj = i915_gem_object_create_internal(engine->i915, 4096);
2708     if (IS_ERR(obj)) {
2709         err = PTR_ERR(obj);
2710         goto err_ce;
2711     }
2712
2713     vma = i915_vma_instance(obj, ce->vm, NULL);
2714     if (IS_ERR(vma)) {
2715         err = PTR_ERR(vma);
2716         goto err_obj;
2717     }
2718
2719     err = i915_vma_pin(vma, 0, 0, PIN_USER);
2720     if (err)
2721         goto err_obj;
2722
2723     cs = i915_gem_object_pin_map_unlocked(obj, I915_MAP_WC);
2724     if (IS_ERR(cs)) {
2725         err = PTR_ERR(cs);
2726         goto err_obj;
2727     }
2728
2729     /* Semaphore target: spin until zero */
2730     *cs++ = MI_ARB_ON_OFF | MI_ARB_ENABLE;
2731
2732     *cs++ = MI_SEMAPHORE_WAIT |
2733         MI_SEMAPHORE_POLL |
2734         MI_SEMAPHORE_SAD_EQ_SDD;
2735     *cs++ = 0;
2736     *cs++ = lower_32_bits(vma->node.start);
2737     *cs++ = upper_32_bits(vma->node.start);
2738
2739     if (*prev) {
2740         u64 offset = (*prev)->batch->node.start;
2741
2742         /* Terminate the spinner in the next lower priority batch. */
2743         *cs++ = MI_STORE_DWORD_IMM_GEN4;
2744         *cs++ = lower_32_bits(offset);
2745         *cs++ = upper_32_bits(offset);
2746         *cs++ = 0;
2747     }
2748
2749     *cs++ = MI_BATCH_BUFFER_END;
2750     i915_gem_object_flush_map(obj);
2751     i915_gem_object_unpin_map(obj);
2752
2753     rq = intel_context_create_request(ce);
2754     if (IS_ERR(rq)) {
2755         err = PTR_ERR(rq);
2756         goto err_obj;
2757     }
2758
2759     rq->batch = i915_vma_get(vma);
2760     i915_request_get(rq);
2761
2762     i915_vma_lock(vma);
2763     err = i915_request_await_object(rq, vma->obj, false);
2764     if (!err)
2765         err = i915_vma_move_to_active(vma, rq, 0);
2766     if (!err)
2767         err = rq->engine->emit_bb_start(rq,
2768                         vma->node.start,
2769                         PAGE_SIZE, 0);
2770     i915_vma_unlock(vma);
2771     i915_request_add(rq);
2772     if (err)
2773         goto err_rq;
2774
2775     i915_gem_object_put(obj);
2776     intel_context_put(ce);
2777
2778     rq->mock.link.next = &(*prev)->mock.link;
2779     *prev = rq;
2780     return 0;
2781
2782 err_rq:
2783     i915_vma_put(rq->batch);
2784     i915_request_put(rq);
2785 err_obj:
2786     i915_gem_object_put(obj);
2787 err_ce:
2788     intel_context_put(ce);
2789     return err;
2790 }
2791
2792 static int __live_preempt_ring(struct intel_engine_cs *engine,
2793                    struct igt_spinner *spin,
2794                    int queue_sz, int ring_sz)
2795 {
2796     struct intel_context *ce[2] = {};
2797     struct i915_request *rq;
2798     struct igt_live_test t;
2799     int err = 0;
2800     int n;
2801
2802     if (igt_live_test_begin(&t, engine->i915, __func__, engine->name))
2803         return -EIO;
2804
2805     for (n = 0; n < ARRAY_SIZE(ce); n++) {
2806         struct intel_context *tmp;
2807
2808         tmp = intel_context_create(engine);
2809         if (IS_ERR(tmp)) {
2810             err = PTR_ERR(tmp);
2811             goto err_ce;
2812         }
2813
2814         tmp->ring_size = ring_sz;
2815
2816         err = intel_context_pin(tmp);
2817         if (err) {
2818             intel_context_put(tmp);
2819             goto err_ce;
2820         }
2821
2822         memset32(tmp->ring->vaddr,
2823              0xdeadbeef, /* trigger a hang if executed */
2824              tmp->ring->vma->size / sizeof(u32));
2825
2826         ce[n] = tmp;
2827     }
2828
2829     rq = igt_spinner_create_request(spin, ce[0], MI_ARB_CHECK);
2830     if (IS_ERR(rq)) {
2831         err = PTR_ERR(rq);
2832         goto err_ce;
2833     }
2834
2835     i915_request_get(rq);
2836     rq->sched.attr.priority = I915_PRIORITY_BARRIER;
2837     i915_request_add(rq);
2838
2839     if (!igt_wait_for_spinner(spin, rq)) {
2840         intel_gt_set_wedged(engine->gt);
2841         i915_request_put(rq);
2842         err = -ETIME;
2843         goto err_ce;
2844     }
2845
2846     /* Fill the ring, until we will cause a wrap */
2847     n = 0;
2848     while (ce[0]->ring->tail - rq->wa_tail <= queue_sz) {
2849         struct i915_request *tmp;
2850
2851         tmp = intel_context_create_request(ce[0]);
2852         if (IS_ERR(tmp)) {
2853             err = PTR_ERR(tmp);
2854             i915_request_put(rq);
2855             goto err_ce;
2856         }
2857
2858         i915_request_add(tmp);
2859         intel_engine_flush_submission(engine);
2860         n++;
2861     }
2862     intel_engine_flush_submission(engine);
2863     pr_debug("%s: Filled %d with %d nop tails {size:%x, tail:%x, emit:%x, rq.tail:%x}\n",
2864          engine->name, queue_sz, n,
2865          ce[0]->ring->size,
2866          ce[0]->ring->tail,
2867          ce[0]->ring->emit,
2868          rq->tail);
2869     i915_request_put(rq);
2870
2871     /* Create a second request to preempt the first ring */
2872     rq = intel_context_create_request(ce[1]);
2873     if (IS_ERR(rq)) {
2874         err = PTR_ERR(rq);
2875         goto err_ce;
2876     }
2877
2878     rq->sched.attr.priority = I915_PRIORITY_BARRIER;
2879     i915_request_get(rq);
2880     i915_request_add(rq);
2881
2882     err = wait_for_submit(engine, rq, HZ / 2);
2883     i915_request_put(rq);
2884     if (err) {
2885         pr_err("%s: preemption request was not submitted\n",
2886                engine->name);
2887         err = -ETIME;
2888     }
2889
2890     pr_debug("%s: ring[0]:{ tail:%x, emit:%x }, ring[1]:{ tail:%x, emit:%x }\n",
2891          engine->name,
2892          ce[0]->ring->tail, ce[0]->ring->emit,
2893          ce[1]->ring->tail, ce[1]->ring->emit);
2894
2895 err_ce:
2896     intel_engine_flush_submission(engine);
2897     igt_spinner_end(spin);
2898     for (n = 0; n < ARRAY_SIZE(ce); n++) {
2899         if (IS_ERR_OR_NULL(ce[n]))
2900             break;
2901
2902         intel_context_unpin(ce[n]);
2903         intel_context_put(ce[n]);
2904     }
2905     if (igt_live_test_end(&t))
2906         err = -EIO;
2907     return err;
2908 }
2909
2910 static int live_preempt_ring(void *arg)
2911 {
2912     struct intel_gt *gt = arg;
2913     struct intel_engine_cs *engine;
2914     struct igt_spinner spin;
2915     enum intel_engine_id id;
2916     int err = 0;
2917
2918     /*
2919      * Check that we rollback large chunks of a ring in order to do a
2920      * preemption event. Similar to live_unlite_ring, but looking at
2921      * ring size rather than the impact of intel_ring_direction().
2922      */
2923
2924     if (igt_spinner_init(&spin, gt))
2925         return -ENOMEM;
2926
2927     for_each_engine(engine, gt, id) {
2928         int n;
2929
2930         if (!intel_engine_has_preemption(engine))
2931             continue;
2932
2933         if (!intel_engine_can_store_dword(engine))
2934             continue;
2935
2936         st_engine_heartbeat_disable(engine);
2937
2938         for (n = 0; n <= 3; n++) {
2939             err = __live_preempt_ring(engine, &spin,
2940                           n * SZ_4K / 4, SZ_4K);
2941             if (err)
2942                 break;
2943         }
2944
2945         st_engine_heartbeat_enable(engine);
2946         if (err)
2947             break;
2948     }
2949
2950     igt_spinner_fini(&spin);
2951     return err;
2952 }
2953
2954 static int live_preempt_gang(void *arg)
2955 {
2956     struct intel_gt *gt = arg;
2957     struct intel_engine_cs *engine;
2958     enum intel_engine_id id;
2959
2960     /*
2961      * Build as long a chain of preempters as we can, with each
2962      * request higher priority than the last. Once we are ready, we release
2963      * the last batch which then precolates down the chain, each releasing
2964      * the next oldest in turn. The intent is to simply push as hard as we
2965      * can with the number of preemptions, trying to exceed narrow HW
2966      * limits. At a minimum, we insist that we can sort all the user
2967      * high priority levels into execution order.
2968      */
2969
2970     for_each_engine(engine, gt, id) {
2971         struct i915_request *rq = NULL;
2972         struct igt_live_test t;
2973         IGT_TIMEOUT(end_time);
2974         int prio = 0;
2975         int err = 0;
2976         u32 *cs;
2977
2978         if (!intel_engine_has_preemption(engine))
2979             continue;
2980
2981         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name))
2982             return -EIO;
2983
2984         do {
2985             struct i915_sched_attr attr = { .priority = prio++ };
2986
2987             err = create_gang(engine, &rq);
2988             if (err)
2989                 break;
2990
2991             /* Submit each spinner at increasing priority */
2992             engine->sched_engine->schedule(rq, &attr);
2993         } while (prio <= I915_PRIORITY_MAX &&
2994              !__igt_timeout(end_time, NULL));
2995         pr_debug("%s: Preempt chain of %d requests\n",
2996              engine->name, prio);
2997
2998         /*
2999          * Such that the last spinner is the highest priority and
3000          * should execute first. When that spinner completes,
3001          * it will terminate the next lowest spinner until there
3002          * are no more spinners and the gang is complete.
3003          */
3004         cs = i915_gem_object_pin_map_unlocked(rq->batch->obj, I915_MAP_WC);
3005         if (!IS_ERR(cs)) {
3006             *cs = 0;
3007             i915_gem_object_unpin_map(rq->batch->obj);
3008         } else {
3009             err = PTR_ERR(cs);
3010             intel_gt_set_wedged(gt);
3011         }
3012
3013         while (rq) { /* wait for each rq from highest to lowest prio */
3014             struct i915_request *n = list_next_entry(rq, mock.link);
3015
3016             if (err == 0 && i915_request_wait(rq, 0, HZ / 5) < 0) {
3017                 struct drm_printer p =
3018                     drm_info_printer(engine->i915->drm.dev);
3019
3020                 pr_err("Failed to flush chain of %d requests, at %d\n",
3021                        prio, rq_prio(rq));
3022                 intel_engine_dump(engine, &p,
3023                           "%s\n", engine->name);
3024
3025                 err = -ETIME;
3026             }
3027
3028             i915_vma_put(rq->batch);
3029             i915_request_put(rq);
3030             rq = n;
3031         }
3032
3033         if (igt_live_test_end(&t))
3034             err = -EIO;
3035         if (err)
3036             return err;
3037     }
3038
3039     return 0;
3040 }
3041
3042 static struct i915_vma *
3043 create_gpr_user(struct intel_engine_cs *engine,
3044         struct i915_vma *result,
3045         unsigned int offset)
3046 {
3047     struct drm_i915_gem_object *obj;
3048     struct i915_vma *vma;
3049     u32 *cs;
3050     int err;
3051     int i;
3052
3053     obj = i915_gem_object_create_internal(engine->i915, 4096);
3054     if (IS_ERR(obj))
3055         return ERR_CAST(obj);
3056
3057     vma = i915_vma_instance(obj, result->vm, NULL);
3058     if (IS_ERR(vma)) {
3059         i915_gem_object_put(obj);
3060         return vma;
3061     }
3062
3063     err = i915_vma_pin(vma, 0, 0, PIN_USER);
3064     if (err) {
3065         i915_vma_put(vma);
3066         return ERR_PTR(err);
3067     }
3068
3069     cs = i915_gem_object_pin_map_unlocked(obj, I915_MAP_WC);
3070     if (IS_ERR(cs)) {
3071         i915_vma_put(vma);
3072         return ERR_CAST(cs);
3073     }
3074
3075     /* All GPR are clear for new contexts. We use GPR(0) as a constant */
3076     *cs++ = MI_LOAD_REGISTER_IMM(1);
3077     *cs++ = CS_GPR(engine, 0);
3078     *cs++ = 1;
3079
3080     for (i = 1; i < NUM_GPR; i++) {
3081         u64 addr;
3082
3083         /*
3084          * Perform: GPR[i]++
3085          *
3086          * As we read and write into the context saved GPR[i], if
3087          * we restart this batch buffer from an earlier point, we
3088          * will repeat the increment and store a value > 1.
3089          */
3090         *cs++ = MI_MATH(4);
3091         *cs++ = MI_MATH_LOAD(MI_MATH_REG_SRCA, MI_MATH_REG(i));
3092         *cs++ = MI_MATH_LOAD(MI_MATH_REG_SRCB, MI_MATH_REG(0));
3093         *cs++ = MI_MATH_ADD;
3094         *cs++ = MI_MATH_STORE(MI_MATH_REG(i), MI_MATH_REG_ACCU);
3095
3096         addr = result->node.start + offset + i * sizeof(*cs);
3097         *cs++ = MI_STORE_REGISTER_MEM_GEN8;
3098         *cs++ = CS_GPR(engine, 2 * i);
3099         *cs++ = lower_32_bits(addr);
3100         *cs++ = upper_32_bits(addr);
3101
3102         *cs++ = MI_SEMAPHORE_WAIT |
3103             MI_SEMAPHORE_POLL |
3104             MI_SEMAPHORE_SAD_GTE_SDD;
3105         *cs++ = i;
3106         *cs++ = lower_32_bits(result->node.start);
3107         *cs++ = upper_32_bits(result->node.start);
3108     }
3109
3110     *cs++ = MI_BATCH_BUFFER_END;
3111     i915_gem_object_flush_map(obj);
3112     i915_gem_object_unpin_map(obj);
3113
3114     return vma;
3115 }
3116
3117 static struct i915_vma *create_global(struct intel_gt *gt, size_t sz)
3118 {
3119     struct drm_i915_gem_object *obj;
3120     struct i915_vma *vma;
3121     int err;
3122
3123     obj = i915_gem_object_create_internal(gt->i915, sz);
3124     if (IS_ERR(obj))
3125         return ERR_CAST(obj);
3126
3127     vma = i915_vma_instance(obj, &gt->ggtt->vm, NULL);
3128     if (IS_ERR(vma)) {
3129         i915_gem_object_put(obj);
3130         return vma;
3131     }
3132
3133     err = i915_ggtt_pin(vma, NULL, 0, 0);
3134     if (err) {
3135         i915_vma_put(vma);
3136         return ERR_PTR(err);
3137     }
3138
3139     return vma;
3140 }
3141
3142 static struct i915_request *
3143 create_gpr_client(struct intel_engine_cs *engine,
3144           struct i915_vma *global,
3145           unsigned int offset)
3146 {
3147     struct i915_vma *batch, *vma;
3148     struct intel_context *ce;
3149     struct i915_request *rq;
3150     int err;
3151
3152     ce = intel_context_create(engine);
3153     if (IS_ERR(ce))
3154         return ERR_CAST(ce);
3155
3156     vma = i915_vma_instance(global->obj, ce->vm, NULL);
3157     if (IS_ERR(vma)) {
3158         err = PTR_ERR(vma);
3159         goto out_ce;
3160     }
3161
3162     err = i915_vma_pin(vma, 0, 0, PIN_USER);
3163     if (err)
3164         goto out_ce;
3165
3166     batch = create_gpr_user(engine, vma, offset);
3167     if (IS_ERR(batch)) {
3168         err = PTR_ERR(batch);
3169         goto out_vma;
3170     }
3171
3172     rq = intel_context_create_request(ce);
3173     if (IS_ERR(rq)) {
3174         err = PTR_ERR(rq);
3175         goto out_batch;
3176     }
3177
3178     i915_vma_lock(vma);
3179     err = i915_request_await_object(rq, vma->obj, false);
3180     if (!err)
3181         err = i915_vma_move_to_active(vma, rq, 0);
3182     i915_vma_unlock(vma);
3183
3184     i915_vma_lock(batch);
3185     if (!err)
3186         err = i915_request_await_object(rq, batch->obj, false);
3187     if (!err)
3188         err = i915_vma_move_to_active(batch, rq, 0);
3189     if (!err)
3190         err = rq->engine->emit_bb_start(rq,
3191                         batch->node.start,
3192                         PAGE_SIZE, 0);
3193     i915_vma_unlock(batch);
3194     i915_vma_unpin(batch);
3195
3196     if (!err)
3197         i915_request_get(rq);
3198     i915_request_add(rq);
3199
3200 out_batch:
3201     i915_vma_put(batch);
3202 out_vma:
3203     i915_vma_unpin(vma);
3204 out_ce:
3205     intel_context_put(ce);
3206     return err ? ERR_PTR(err) : rq;
3207 }
3208
3209 static int preempt_user(struct intel_engine_cs *engine,
3210             struct i915_vma *global,
3211             int id)
3212 {
3213     struct i915_sched_attr attr = {
3214         .priority = I915_PRIORITY_MAX
3215     };
3216     struct i915_request *rq;
3217     int err = 0;
3218     u32 *cs;
3219
3220     rq = intel_engine_create_kernel_request(engine);
3221     if (IS_ERR(rq))
3222         return PTR_ERR(rq);
3223
3224     cs = intel_ring_begin(rq, 4);
3225     if (IS_ERR(cs)) {
3226         i915_request_add(rq);
3227         return PTR_ERR(cs);
3228     }
3229
3230     *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
3231     *cs++ = i915_ggtt_offset(global);
3232     *cs++ = 0;
3233     *cs++ = id;
3234
3235     intel_ring_advance(rq, cs);
3236
3237     i915_request_get(rq);
3238     i915_request_add(rq);
3239
3240     engine->sched_engine->schedule(rq, &attr);
3241
3242     if (i915_request_wait(rq, 0, HZ / 2) < 0)
3243         err = -ETIME;
3244     i915_request_put(rq);
3245
3246     return err;
3247 }
3248
3249 static int live_preempt_user(void *arg)
3250 {
3251     struct intel_gt *gt = arg;
3252     struct intel_engine_cs *engine;
3253     struct i915_vma *global;
3254     enum intel_engine_id id;
3255     u32 *result;
3256     int err = 0;
3257
3258     /*
3259      * In our other tests, we look at preemption in carefully
3260      * controlled conditions in the ringbuffer. Since most of the
3261      * time is spent in user batches, most of our preemptions naturally
3262      * occur there. We want to verify that when we preempt inside a batch
3263      * we continue on from the current instruction and do not roll back
3264      * to the start, or another earlier arbitration point.
3265      *
3266      * To verify this, we create a batch which is a mixture of
3267      * MI_MATH (gpr++) MI_SRM (gpr) and preemption points. Then with
3268      * a few preempting contexts thrown into the mix, we look for any
3269      * repeated instructions (which show up as incorrect values).
3270      */
3271
3272     global = create_global(gt, 4096);
3273     if (IS_ERR(global))
3274         return PTR_ERR(global);
3275
3276     result = i915_gem_object_pin_map_unlocked(global->obj, I915_MAP_WC);
3277     if (IS_ERR(result)) {
3278         i915_vma_unpin_and_release(&global, 0);
3279         return PTR_ERR(result);
3280     }
3281
3282     for_each_engine(engine, gt, id) {
3283         struct i915_request *client[3] = {};
3284         struct igt_live_test t;
3285         int i;
3286
3287         if (!intel_engine_has_preemption(engine))
3288             continue;
3289
3290         if (GRAPHICS_VER(gt->i915) == 8 && engine->class != RENDER_CLASS)
3291             continue; /* we need per-context GPR */
3292
3293         if (igt_live_test_begin(&t, gt->i915, __func__, engine->name)) {
3294             err = -EIO;
3295             break;
3296         }
3297
3298         memset(result, 0, 4096);
3299
3300         for (i = 0; i < ARRAY_SIZE(client); i++) {
3301             struct i915_request *rq;
3302
3303             rq = create_gpr_client(engine, global,
3304                            NUM_GPR * i * sizeof(u32));
3305             if (IS_ERR(rq)) {
3306                 err = PTR_ERR(rq);
3307                 goto end_test;
3308             }
3309
3310             client[i] = rq;
3311         }
3312
3313         /* Continuously preempt the set of 3 running contexts */
3314         for (i = 1; i <= NUM_GPR; i++) {
3315             err = preempt_user(engine, global, i);
3316             if (err)
3317                 goto end_test;
3318         }
3319
3320         if (READ_ONCE(result[0]) != NUM_GPR) {
3321             pr_err("%s: Failed to release semaphore\n",
3322                    engine->name);
3323             err = -EIO;
3324             goto end_test;
3325         }
3326
3327         for (i = 0; i < ARRAY_SIZE(client); i++) {
3328             int gpr;
3329
3330             if (i915_request_wait(client[i], 0, HZ / 2) < 0) {
3331                 err = -ETIME;
3332                 goto end_test;
3333             }
3334
3335             for (gpr = 1; gpr < NUM_GPR; gpr++) {
3336                 if (result[NUM_GPR * i + gpr] != 1) {
3337                     pr_err("%s: Invalid result, client %d, gpr %d, result: %d\n",
3338                            engine->name,
3339                            i, gpr, result[NUM_GPR * i + gpr]);
3340                     err = -EINVAL;
3341                     goto end_test;
3342                 }
3343             }
3344         }
3345
3346 end_test:
3347         for (i = 0; i < ARRAY_SIZE(client); i++) {
3348             if (!client[i])
3349                 break;
3350
3351             i915_request_put(client[i]);
3352         }
3353
3354         /* Flush the semaphores on error */
3355         smp_store_mb(result[0], -1);
3356         if (igt_live_test_end(&t))
3357             err = -EIO;
3358         if (err)
3359             break;
3360     }
3361
3362     i915_vma_unpin_and_release(&global, I915_VMA_RELEASE_MAP);
3363     return err;
3364 }
3365
3366 static int live_preempt_timeout(void *arg)
3367 {
3368     struct intel_gt *gt = arg;
3369     struct i915_gem_context *ctx_hi, *ctx_lo;
3370     struct igt_spinner spin_lo;
3371     struct intel_engine_cs *engine;
3372     enum intel_engine_id id;
3373     int err = -ENOMEM;
3374
3375     /*
3376      * Check that we force preemption to occur by cancelling the previous
3377      * context if it refuses to yield the GPU.
3378      */
3379     if (!CONFIG_DRM_I915_PREEMPT_TIMEOUT)
3380         return 0;
3381
3382     if (!intel_has_reset_engine(gt))
3383         return 0;
3384
3385     ctx_hi = kernel_context(gt->i915, NULL);
3386     if (!ctx_hi)
3387         return -ENOMEM;
3388     ctx_hi->sched.priority = I915_CONTEXT_MAX_USER_PRIORITY;
3389
3390     ctx_lo = kernel_context(gt->i915, NULL);
3391     if (!ctx_lo)
3392         goto err_ctx_hi;
3393     ctx_lo->sched.priority = I915_CONTEXT_MIN_USER_PRIORITY;
3394
3395     if (igt_spinner_init(&spin_lo, gt))
3396         goto err_ctx_lo;
3397
3398     for_each_engine(engine, gt, id) {
3399         unsigned long saved_timeout;
3400         struct i915_request *rq;
3401
3402         if (!intel_engine_has_preemption(engine))
3403             continue;
3404
3405         rq = spinner_create_request(&spin_lo, ctx_lo, engine,
3406                         MI_NOOP); /* preemption disabled */
3407         if (IS_ERR(rq)) {
3408             err = PTR_ERR(rq);
3409             goto err_spin_lo;
3410         }
3411
3412         i915_request_add(rq);
3413         if (!igt_wait_for_spinner(&spin_lo, rq)) {
3414             intel_gt_set_wedged(gt);
3415             err = -EIO;
3416             goto err_spin_lo;
3417         }
3418
3419         rq = igt_request_alloc(ctx_hi, engine);
3420         if (IS_ERR(rq)) {
3421             igt_spinner_end(&spin_lo);
3422             err = PTR_ERR(rq);
3423             goto err_spin_lo;
3424         }
3425
3426         /* Flush the previous CS ack before changing timeouts */
3427         while (READ_ONCE(engine->execlists.pending[0]))
3428             cpu_relax();
3429
3430         saved_timeout = engine->props.preempt_timeout_ms;
3431         engine->props.preempt_timeout_ms = 1; /* in ms, -> 1 jiffie */
3432
3433         i915_request_get(rq);
3434         i915_request_add(rq);
3435
3436         intel_engine_flush_submission(engine);
3437         engine->props.preempt_timeout_ms = saved_timeout;
3438
3439         if (i915_request_wait(rq, 0, HZ / 10) < 0) {
3440             intel_gt_set_wedged(gt);
3441             i915_request_put(rq);
3442             err = -ETIME;
3443             goto err_spin_lo;
3444         }
3445
3446         igt_spinner_end(&spin_lo);
3447         i915_request_put(rq);
3448     }
3449
3450     err = 0;
3451 err_spin_lo:
3452     igt_spinner_fini(&spin_lo);
3453 err_ctx_lo:
3454     kernel_context_close(ctx_lo);
3455 err_ctx_hi:
3456     kernel_context_close(ctx_hi);
3457     return err;
3458 }
3459
3460 static int random_range(struct rnd_state *rnd, int min, int max)
3461 {
3462     return i915_prandom_u32_max_state(max - min, rnd) + min;
3463 }
3464
3465 static int random_priority(struct rnd_state *rnd)
3466 {
3467     return random_range(rnd, I915_PRIORITY_MIN, I915_PRIORITY_MAX);
3468 }
3469
3470 struct preempt_smoke {
3471     struct intel_gt *gt;
3472     struct i915_gem_context **contexts;
3473     struct intel_engine_cs *engine;
3474     struct drm_i915_gem_object *batch;
3475     unsigned int ncontext;
3476     struct rnd_state prng;
3477     unsigned long count;
3478 };
3479
3480 static struct i915_gem_context *smoke_context(struct preempt_smoke *smoke)
3481 {
3482     return smoke->contexts[i915_prandom_u32_max_state(smoke->ncontext,
3483                               &smoke->prng)];
3484 }
3485
3486 static int smoke_submit(struct preempt_smoke *smoke,
3487             struct i915_gem_context *ctx, int prio,
3488             struct drm_i915_gem_object *batch)
3489 {
3490     struct i915_request *rq;
3491     struct i915_vma *vma = NULL;
3492     int err = 0;
3493
3494     if (batch) {
3495         struct i915_address_space *vm;
3496
3497         vm = i915_gem_context_get_eb_vm(ctx);
3498         vma = i915_vma_instance(batch, vm, NULL);
3499         i915_vm_put(vm);
3500         if (IS_ERR(vma))
3501             return PTR_ERR(vma);
3502
3503         err = i915_vma_pin(vma, 0, 0, PIN_USER);
3504         if (err)
3505             return err;
3506     }
3507
3508     ctx->sched.priority = prio;
3509
3510     rq = igt_request_alloc(ctx, smoke->engine);
3511     if (IS_ERR(rq)) {
3512         err = PTR_ERR(rq);
3513         goto unpin;
3514     }
3515
3516     if (vma) {
3517         i915_vma_lock(vma);
3518         err = i915_request_await_object(rq, vma->obj, false);
3519         if (!err)
3520             err = i915_vma_move_to_active(vma, rq, 0);
3521         if (!err)
3522             err = rq->engine->emit_bb_start(rq,
3523                             vma->node.start,
3524                             PAGE_SIZE, 0);
3525         i915_vma_unlock(vma);
3526     }
3527
3528     i915_request_add(rq);
3529
3530 unpin:
3531     if (vma)
3532         i915_vma_unpin(vma);
3533
3534     return err;
3535 }
3536
3537 static int smoke_crescendo_thread(void *arg)
3538 {
3539     struct preempt_smoke *smoke = arg;
3540     IGT_TIMEOUT(end_time);
3541     unsigned long count;
3542
3543     count = 0;
3544     do {
3545         struct i915_gem_context *ctx = smoke_context(smoke);
3546         int err;
3547
3548         err = smoke_submit(smoke,
3549                    ctx, count % I915_PRIORITY_MAX,
3550                    smoke->batch);
3551         if (err)
3552             return err;
3553
3554         count++;
3555     } while (count < smoke->ncontext && !__igt_timeout(end_time, NULL));
3556
3557     smoke->count = count;
3558     return 0;
3559 }
3560
3561 static int smoke_crescendo(struct preempt_smoke *smoke, unsigned int flags)
3562 #define BATCH BIT(0)
3563 {
3564     struct task_struct *tsk[I915_NUM_ENGINES] = {};
3565     struct preempt_smoke *arg;
3566     struct intel_engine_cs *engine;
3567     enum intel_engine_id id;
3568     unsigned long count;
3569     int err = 0;
3570
3571     arg = kmalloc_array(I915_NUM_ENGINES, sizeof(*arg), GFP_KERNEL);
3572     if (!arg)
3573         return -ENOMEM;
3574
3575     for_each_engine(engine, smoke->gt, id) {
3576         arg[id] = *smoke;
3577         arg[id].engine = engine;
3578         if (!(flags & BATCH))
3579             arg[id].batch = NULL;
3580         arg[id].count = 0;
3581
3582         tsk[id] = kthread_run(smoke_crescendo_thread, arg,
3583                       "igt/smoke:%d", id);
3584         if (IS_ERR(tsk[id])) {
3585             err = PTR_ERR(tsk[id]);
3586             break;
3587         }
3588         get_task_struct(tsk[id]);
3589     }
3590
3591     yield(); /* start all threads before we kthread_stop() */
3592
3593     count = 0;
3594     for_each_engine(engine, smoke->gt, id) {
3595         int status;
3596
3597         if (IS_ERR_OR_NULL(tsk[id]))
3598             continue;
3599
3600         status = kthread_stop(tsk[id]);
3601         if (status && !err)
3602             err = status;
3603
3604         count += arg[id].count;
3605
3606         put_task_struct(tsk[id]);
3607     }
3608
3609     pr_info("Submitted %lu crescendo:%x requests across %d engines and %d contexts\n",
3610         count, flags, smoke->gt->info.num_engines, smoke->ncontext);
3611
3612     kfree(arg);
3613     return 0;
3614 }
3615
3616 static int smoke_random(struct preempt_smoke *smoke, unsigned int flags)
3617 {
3618     enum intel_engine_id id;
3619     IGT_TIMEOUT(end_time);
3620     unsigned long count;
3621
3622     count = 0;
3623     do {
3624         for_each_engine(smoke->engine, smoke->gt, id) {
3625             struct i915_gem_context *ctx = smoke_context(smoke);
3626             int err;
3627
3628             err = smoke_submit(smoke,
3629                        ctx, random_priority(&smoke->prng),
3630                        flags & BATCH ? smoke->batch : NULL);
3631             if (err)
3632                 return err;
3633
3634             count++;
3635         }
3636     } while (count < smoke->ncontext && !__igt_timeout(end_time, NULL));
3637
3638     pr_info("Submitted %lu random:%x requests across %d engines and %d contexts\n",
3639         count, flags, smoke->gt->info.num_engines, smoke->ncontext);
3640     return 0;
3641 }
3642
3643 static int live_preempt_smoke(void *arg)
3644 {
3645     struct preempt_smoke smoke = {
3646         .gt = arg,
3647         .prng = I915_RND_STATE_INITIALIZER(i915_selftest.random_seed),
3648         .ncontext = 256,
3649     };
3650     const unsigned int phase[] = { 0, BATCH };
3651     struct igt_live_test t;
3652     int err = -ENOMEM;
3653     u32 *cs;
3654     int n;
3655
3656     smoke.contexts = kmalloc_array(smoke.ncontext,
3657                        sizeof(*smoke.contexts),
3658                        GFP_KERNEL);
3659     if (!smoke.contexts)
3660         return -ENOMEM;
3661
3662     smoke.batch =
3663         i915_gem_object_create_internal(smoke.gt->i915, PAGE_SIZE);
3664     if (IS_ERR(smoke.batch)) {
3665         err = PTR_ERR(smoke.batch);
3666         goto err_free;
3667     }
3668
3669     cs = i915_gem_object_pin_map_unlocked(smoke.batch, I915_MAP_WB);
3670     if (IS_ERR(cs)) {
3671         err = PTR_ERR(cs);
3672         goto err_batch;
3673     }
3674     for (n = 0; n < PAGE_SIZE / sizeof(*cs) - 1; n++)
3675         cs[n] = MI_ARB_CHECK;
3676     cs[n] = MI_BATCH_BUFFER_END;
3677     i915_gem_object_flush_map(smoke.batch);
3678     i915_gem_object_unpin_map(smoke.batch);
3679
3680     if (igt_live_test_begin(&t, smoke.gt->i915, __func__, "all")) {
3681         err = -EIO;
3682         goto err_batch;
3683     }
3684
3685     for (n = 0; n < smoke.ncontext; n++) {
3686         smoke.contexts[n] = kernel_context(smoke.gt->i915, NULL);
3687         if (!smoke.contexts[n])
3688             goto err_ctx;
3689     }
3690
3691     for (n = 0; n < ARRAY_SIZE(phase); n++) {
3692         err = smoke_crescendo(&smoke, phase[n]);
3693         if (err)
3694             goto err_ctx;
3695
3696         err = smoke_random(&smoke, phase[n]);
3697         if (err)
3698             goto err_ctx;
3699     }
3700
3701 err_ctx:
3702     if (igt_live_test_end(&t))
3703         err = -EIO;
3704
3705     for (n = 0; n < smoke.ncontext; n++) {
3706         if (!smoke.contexts[n])
3707             break;
3708         kernel_context_close(smoke.contexts[n]);
3709     }
3710
3711 err_batch:
3712     i915_gem_object_put(smoke.batch);
3713 err_free:
3714     kfree(smoke.contexts);
3715
3716     return err;
3717 }
3718
3719 static int nop_virtual_engine(struct intel_gt *gt,
3720                   struct intel_engine_cs **siblings,
3721                   unsigned int nsibling,
3722                   unsigned int nctx,
3723                   unsigned int flags)
3724 #define CHAIN BIT(0)
3725 {
3726     IGT_TIMEOUT(end_time);
3727     struct i915_request *request[16] = {};
3728     struct intel_context *ve[16];
3729     unsigned long n, prime, nc;
3730     struct igt_live_test t;
3731     ktime_t times[2] = {};
3732     int err;
3733
3734     GEM_BUG_ON(!nctx || nctx > ARRAY_SIZE(ve));
3735
3736     for (n = 0; n < nctx; n++) {
3737         ve[n] = intel_engine_create_virtual(siblings, nsibling, 0);
3738         if (IS_ERR(ve[n])) {
3739             err = PTR_ERR(ve[n]);
3740             nctx = n;
3741             goto out;
3742         }
3743
3744         err = intel_context_pin(ve[n]);
3745         if (err) {
3746             intel_context_put(ve[n]);
3747             nctx = n;
3748             goto out;
3749         }
3750     }
3751
3752     err = igt_live_test_begin(&t, gt->i915, __func__, ve[0]->engine->name);
3753     if (err)
3754         goto out;
3755
3756     for_each_prime_number_from(prime, 1, 8192) {
3757         times[1] = ktime_get_raw();
3758
3759         if (flags & CHAIN) {
3760             for (nc = 0; nc < nctx; nc++) {
3761                 for (n = 0; n < prime; n++) {
3762                     struct i915_request *rq;
3763
3764                     rq = i915_request_create(ve[nc]);
3765                     if (IS_ERR(rq)) {
3766                         err = PTR_ERR(rq);
3767                         goto out;
3768                     }
3769
3770                     if (request[nc])
3771                         i915_request_put(request[nc]);
3772                     request[nc] = i915_request_get(rq);
3773                     i915_request_add(rq);
3774                 }
3775             }
3776         } else {
3777             for (n = 0; n < prime; n++) {
3778                 for (nc = 0; nc < nctx; nc++) {
3779                     struct i915_request *rq;
3780
3781                     rq = i915_request_create(ve[nc]);
3782                     if (IS_ERR(rq)) {
3783                         err = PTR_ERR(rq);
3784                         goto out;
3785                     }
3786
3787                     if (request[nc])
3788                         i915_request_put(request[nc]);
3789                     request[nc] = i915_request_get(rq);
3790                     i915_request_add(rq);
3791                 }
3792             }
3793         }
3794
3795         for (nc = 0; nc < nctx; nc++) {
3796             if (i915_request_wait(request[nc], 0, HZ / 10) < 0) {
3797                 pr_err("%s(%s): wait for %llx:%lld timed out\n",
3798                        __func__, ve[0]->engine->name,
3799                        request[nc]->fence.context,
3800                        request[nc]->fence.seqno);
3801
3802                 GEM_TRACE("%s(%s) failed at request %llx:%lld\n",
3803                       __func__, ve[0]->engine->name,
3804                       request[nc]->fence.context,
3805                       request[nc]->fence.seqno);
3806                 GEM_TRACE_DUMP();
3807                 intel_gt_set_wedged(gt);
3808                 break;
3809             }
3810         }
3811
3812         times[1] = ktime_sub(ktime_get_raw(), times[1]);
3813         if (prime == 1)
3814             times[0] = times[1];
3815
3816         for (nc = 0; nc < nctx; nc++) {
3817             i915_request_put(request[nc]);
3818             request[nc] = NULL;
3819         }
3820
3821         if (__igt_timeout(end_time, NULL))
3822             break;
3823     }
3824
3825     err = igt_live_test_end(&t);
3826     if (err)
3827         goto out;
3828
3829     pr_info("Requestx%d latencies on %s: 1 = %lluns, %lu = %lluns\n",
3830         nctx, ve[0]->engine->name, ktime_to_ns(times[0]),
3831         prime, div64_u64(ktime_to_ns(times[1]), prime));
3832
3833 out:
3834     if (igt_flush_test(gt->i915))
3835         err = -EIO;
3836
3837     for (nc = 0; nc < nctx; nc++) {
3838         i915_request_put(request[nc]);
3839         intel_context_unpin(ve[nc]);
3840         intel_context_put(ve[nc]);
3841     }
3842     return err;
3843 }
3844
3845 static unsigned int
3846 __select_siblings(struct intel_gt *gt,
3847           unsigned int class,
3848           struct intel_engine_cs **siblings,
3849           bool (*filter)(const struct intel_engine_cs *))
3850 {
3851     unsigned int n = 0;
3852     unsigned int inst;
3853
3854     for (inst = 0; inst <= MAX_ENGINE_INSTANCE; inst++) {
3855         if (!gt->engine_class[class][inst])
3856             continue;
3857
3858         if (filter && !filter(gt->engine_class[class][inst]))
3859             continue;
3860
3861         siblings[n++] = gt->engine_class[class][inst];
3862     }
3863
3864     return n;
3865 }
3866
3867 static unsigned int
3868 select_siblings(struct intel_gt *gt,
3869         unsigned int class,
3870         struct intel_engine_cs **siblings)
3871 {
3872     return __select_siblings(gt, class, siblings, NULL);
3873 }
3874
3875 static int live_virtual_engine(void *arg)
3876 {
3877     struct intel_gt *gt = arg;
3878     struct intel_engine_cs *siblings[MAX_ENGINE_INSTANCE + 1];
3879     struct intel_engine_cs *engine;
3880     enum intel_engine_id id;
3881     unsigned int class;
3882     int err;
3883
3884     if (intel_uc_uses_guc_submission(&gt->uc))
3885         return 0;
3886
3887     for_each_engine(engine, gt, id) {
3888         err = nop_virtual_engine(gt, &engine, 1, 1, 0);
3889         if (err) {
3890             pr_err("Failed to wrap engine %s: err=%d\n",
3891                    engine->name, err);
3892             return err;
3893         }
3894     }
3895
3896     for (class = 0; class <= MAX_ENGINE_CLASS; class++) {
3897         int nsibling, n;
3898
3899         nsibling = select_siblings(gt, class, siblings);
3900         if (nsibling < 2)
3901             continue;
3902
3903         for (n = 1; n <= nsibling + 1; n++) {
3904             err = nop_virtual_engine(gt, siblings, nsibling,
3905                          n, 0);
3906             if (err)
3907                 return err;
3908         }
3909
3910         err = nop_virtual_engine(gt, siblings, nsibling, n, CHAIN);
3911         if (err)
3912             return err;
3913     }
3914
3915     return 0;
3916 }
3917
3918 static int mask_virtual_engine(struct intel_gt *gt,
3919                    struct intel_engine_cs **siblings,
3920                    unsigned int nsibling)
3921 {
3922     struct i915_request *request[MAX_ENGINE_INSTANCE + 1];
3923     struct intel_context *ve;
3924     struct igt_live_test t;
3925     unsigned int n;
3926     int err;
3927
3928     /*
3929      * Check that by setting the execution mask on a request, we can
3930      * restrict it to our desired engine within the virtual engine.
3931      */
3932
3933     ve = intel_engine_create_virtual(siblings, nsibling, 0);
3934     if (IS_ERR(ve)) {
3935         err = PTR_ERR(ve);
3936         goto out_close;
3937     }
3938
3939     err = intel_context_pin(ve);
3940     if (err)
3941         goto out_put;
3942
3943     err = igt_live_test_begin(&t, gt->i915, __func__, ve->engine->name);
3944     if (err)
3945         goto out_unpin;
3946
3947     for (n = 0; n < nsibling; n++) {
3948         request[n] = i915_request_create(ve);
3949         if (IS_ERR(request[n])) {
3950             err = PTR_ERR(request[n]);
3951             nsibling = n;
3952             goto out;
3953         }
3954
3955         /* Reverse order as it's more likely to be unnatural */
3956         request[n]->execution_mask = siblings[nsibling - n - 1]->mask;
3957
3958         i915_request_get(request[n]);
3959         i915_request_add(request[n]);
3960     }
3961
3962     for (n = 0; n < nsibling; n++) {
3963         if (i915_request_wait(request[n], 0, HZ / 10) < 0) {
3964             pr_err("%s(%s): wait for %llx:%lld timed out\n",
3965                    __func__, ve->engine->name,
3966                    request[n]->fence.context,
3967                    request[n]->fence.seqno);
3968
3969             GEM_TRACE("%s(%s) failed at request %llx:%lld\n",
3970                   __func__, ve->engine->name,
3971                   request[n]->fence.context,
3972                   request[n]->fence.seqno);
3973             GEM_TRACE_DUMP();
3974             intel_gt_set_wedged(gt);
3975             err = -EIO;
3976             goto out;
3977         }
3978
3979         if (request[n]->engine != siblings[nsibling - n - 1]) {
3980             pr_err("Executed on wrong sibling '%s', expected '%s'\n",
3981                    request[n]->engine->name,
3982                    siblings[nsibling - n - 1]->name);
3983             err = -EINVAL;
3984             goto out;
3985         }
3986     }
3987
3988     err = igt_live_test_end(&t);
3989 out:
3990     if (igt_flush_test(gt->i915))
3991         err = -EIO;
3992
3993     for (n = 0; n < nsibling; n++)
3994         i915_request_put(request[n]);
3995
3996 out_unpin:
3997     intel_context_unpin(ve);
3998 out_put:
3999     intel_context_put(ve);
4000 out_close:
4001     return err;
4002 }
4003
4004 static int live_virtual_mask(void *arg)
4005 {
4006     struct intel_gt *gt = arg;
4007     struct intel_engine_cs *siblings[MAX_ENGINE_INSTANCE + 1];
4008     unsigned int class;
4009     int err;
4010
4011     if (intel_uc_uses_guc_submission(&gt->uc))
4012         return 0;
4013
4014     for (class = 0; class <= MAX_ENGINE_CLASS; class++) {
4015         unsigned int nsibling;
4016
4017         nsibling = select_siblings(gt, class, siblings);
4018         if (nsibling < 2)
4019             continue;
4020
4021         err = mask_virtual_engine(gt, siblings, nsibling);
4022         if (err)
4023             return err;
4024     }
4025
4026     return 0;
4027 }
4028
4029 static int slicein_virtual_engine(struct intel_gt *gt,
4030                   struct intel_engine_cs **siblings,
4031                   unsigned int nsibling)
4032 {
4033     const long timeout = slice_timeout(siblings[0]);
4034     struct intel_context *ce;
4035     struct i915_request *rq;
4036     struct igt_spinner spin;
4037     unsigned int n;
4038     int err = 0;
4039
4040     /*
4041      * Virtual requests must take part in timeslicing on the target engines.
4042      */
4043
4044     if (igt_spinner_init(&spin, gt))
4045         return -ENOMEM;
4046
4047     for (n = 0; n < nsibling; n++) {
4048         ce = intel_context_create(siblings[n]);
4049         if (IS_ERR(ce)) {
4050             err = PTR_ERR(ce);
4051             goto out;
4052         }
4053
4054         rq = igt_spinner_create_request(&spin, ce, MI_ARB_CHECK);
4055         intel_context_put(ce);
4056         if (IS_ERR(rq)) {
4057             err = PTR_ERR(rq);
4058             goto out;
4059         }
4060
4061         i915_request_add(rq);
4062     }
4063
4064     ce = intel_engine_create_virtual(siblings, nsibling, 0);
4065     if (IS_ERR(ce)) {
4066         err = PTR_ERR(ce);
4067         goto out;
4068     }
4069
4070     rq = intel_context_create_request(ce);
4071     intel_context_put(ce);
4072     if (IS_ERR(rq)) {
4073         err = PTR_ERR(rq);
4074         goto out;
4075     }
4076
4077     i915_request_get(rq);
4078     i915_request_add(rq);
4079     if (i915_request_wait(rq, 0, timeout) < 0) {
4080         GEM_TRACE_ERR("%s(%s) failed to slice in virtual request\n",
4081                   __func__, rq->engine->name);
4082         GEM_TRACE_DUMP();
4083         intel_gt_set_wedged(gt);
4084         err = -EIO;
4085     }
4086     i915_request_put(rq);
4087
4088 out:
4089     igt_spinner_end(&spin);
4090     if (igt_flush_test(gt->i915))
4091         err = -EIO;
4092     igt_spinner_fini(&spin);
4093     return err;
4094 }
4095
4096 static int sliceout_virtual_engine(struct intel_gt *gt,
4097                    struct intel_engine_cs **siblings,
4098                    unsigned int nsibling)
4099 {
4100     const long timeout = slice_timeout(siblings[0]);
4101     struct intel_context *ce;
4102     struct i915_request *rq;
4103     struct igt_spinner spin;
4104     unsigned int n;
4105     int err = 0;
4106
4107     /*
4108      * Virtual requests must allow others a fair timeslice.
4109      */
4110
4111     if (igt_spinner_init(&spin, gt))
4112         return -ENOMEM;
4113
4114     /* XXX We do not handle oversubscription and fairness with normal rq */
4115     for (n = 0; n < nsibling; n++) {
4116         ce = intel_engine_create_virtual(siblings, nsibling, 0);
4117         if (IS_ERR(ce)) {
4118             err = PTR_ERR(ce);
4119             goto out;
4120         }
4121
4122         rq = igt_spinner_create_request(&spin, ce, MI_ARB_CHECK);
4123         intel_context_put(ce);
4124         if (IS_ERR(rq)) {
4125             err = PTR_ERR(rq);
4126             goto out;
4127         }
4128
4129         i915_request_add(rq);
4130     }
4131
4132     for (n = 0; !err && n < nsibling; n++) {
4133         ce = intel_context_create(siblings[n]);
4134         if (IS_ERR(ce)) {
4135             err = PTR_ERR(ce);
4136             goto out;
4137         }
4138
4139         rq = intel_context_create_request(ce);
4140         intel_context_put(ce);
4141         if (IS_ERR(rq)) {
4142             err = PTR_ERR(rq);
4143             goto out;
4144         }
4145
4146         i915_request_get(rq);
4147         i915_request_add(rq);
4148         if (i915_request_wait(rq, 0, timeout) < 0) {
4149             GEM_TRACE_ERR("%s(%s) failed to slice out virtual request\n",
4150                       __func__, siblings[n]->name);
4151             GEM_TRACE_DUMP();
4152             intel_gt_set_wedged(gt);
4153             err = -EIO;
4154         }
4155         i915_request_put(rq);
4156     }
4157
4158 out:
4159     igt_spinner_end(&spin);
4160     if (igt_flush_test(gt->i915))
4161         err = -EIO;
4162     igt_spinner_fini(&spin);
4163     return err;
4164 }
4165
4166 static int live_virtual_slice(void *arg)
4167 {
4168     struct intel_gt *gt = arg;
4169     struct intel_engine_cs *siblings[MAX_ENGINE_INSTANCE + 1];
4170     unsigned int class;
4171     int err;
4172
4173     if (intel_uc_uses_guc_submission(&gt->uc))
4174         return 0;
4175
4176     for (class = 0; class <= MAX_ENGINE_CLASS; class++) {
4177         unsigned int nsibling;
4178
4179         nsibling = __select_siblings(gt, class, siblings,
4180                          intel_engine_has_timeslices);
4181         if (nsibling < 2)
4182             continue;
4183
4184         err = slicein_virtual_engine(gt, siblings, nsibling);
4185         if (err)
4186             return err;
4187
4188         err = sliceout_virtual_engine(gt, siblings, nsibling);
4189         if (err)
4190             return err;
4191     }
4192
4193     return 0;
4194 }
4195
4196 static int preserved_virtual_engine(struct intel_gt *gt,
4197                     struct intel_engine_cs **siblings,
4198                     unsigned int nsibling)
4199 {
4200     struct i915_request *last = NULL;
4201     struct intel_context *ve;
4202     struct i915_vma *scratch;
4203     struct igt_live_test t;
4204     unsigned int n;
4205     int err = 0;
4206     u32 *cs;
4207
4208     scratch =
4209         __vm_create_scratch_for_read_pinned(&siblings[0]->gt->ggtt->vm,
4210                             PAGE_SIZE);
4211     if (IS_ERR(scratch))
4212         return PTR_ERR(scratch);
4213
4214     err = i915_vma_sync(scratch);
4215     if (err)
4216         goto out_scratch;
4217
4218     ve = intel_engine_create_virtual(siblings, nsibling, 0);
4219     if (IS_ERR(ve)) {
4220         err = PTR_ERR(ve);
4221         goto out_scratch;
4222     }
4223
4224     err = intel_context_pin(ve);
4225     if (err)
4226         goto out_put;
4227
4228     err = igt_live_test_begin(&t, gt->i915, __func__, ve->engine->name);
4229     if (err)
4230         goto out_unpin;
4231
4232     for (n = 0; n < NUM_GPR_DW; n++) {
4233         struct intel_engine_cs *engine = siblings[n % nsibling];
4234         struct i915_request *rq;
4235
4236         rq = i915_request_create(ve);
4237         if (IS_ERR(rq)) {
4238             err = PTR_ERR(rq);
4239             goto out_end;
4240         }
4241
4242         i915_request_put(last);
4243         last = i915_request_get(rq);
4244
4245         cs = intel_ring_begin(rq, 8);
4246         if (IS_ERR(cs)) {
4247             i915_request_add(rq);
4248             err = PTR_ERR(cs);
4249             goto out_end;
4250         }
4251
4252         *cs++ = MI_STORE_REGISTER_MEM_GEN8 | MI_USE_GGTT;
4253         *cs++ = CS_GPR(engine, n);
4254         *cs++ = i915_ggtt_offset(scratch) + n * sizeof(u32);
4255         *cs++ = 0;
4256
4257         *cs++ = MI_LOAD_REGISTER_IMM(1);
4258         *cs++ = CS_GPR(engine, (n + 1) % NUM_GPR_DW);
4259         *cs++ = n + 1;
4260
4261         *cs++ = MI_NOOP;
4262         intel_ring_advance(rq, cs);
4263
4264         /* Restrict this request to run on a particular engine */
4265         rq->execution_mask = engine->mask;
4266         i915_request_add(rq);
4267     }
4268
4269     if (i915_request_wait(last, 0, HZ / 5) < 0) {
4270         err = -ETIME;
4271         goto out_end;
4272     }
4273
4274     cs = i915_gem_object_pin_map_unlocked(scratch->obj, I915_MAP_WB);
4275     if (IS_ERR(cs)) {
4276         err = PTR_ERR(cs);
4277         goto out_end;
4278     }
4279
4280     for (n = 0; n < NUM_GPR_DW; n++) {
4281         if (cs[n] != n) {
4282             pr_err("Incorrect value[%d] found for GPR[%d]\n",
4283                    cs[n], n);
4284             err = -EINVAL;
4285             break;
4286         }
4287     }
4288
4289     i915_gem_object_unpin_map(scratch->obj);
4290
4291 out_end:
4292     if (igt_live_test_end(&t))
4293         err = -EIO;
4294     i915_request_put(last);
4295 out_unpin:
4296     intel_context_unpin(ve);
4297 out_put:
4298     intel_context_put(ve);
4299 out_scratch:
4300     i915_vma_unpin_and_release(&scratch, 0);
4301     return err;
4302 }
4303
4304 static int live_virtual_preserved(void *arg)
4305 {
4306     struct intel_gt *gt = arg;
4307     struct intel_engine_cs *siblings[MAX_ENGINE_INSTANCE + 1];
4308     unsigned int class;
4309
4310     /*
4311      * Check that the context image retains non-privileged (user) registers
4312      * from one engine to the next. For this we check that the CS_GPR
4313      * are preserved.
4314      */
4315
4316     if (intel_uc_uses_guc_submission(&gt->uc))
4317         return 0;
4318
4319     /* As we use CS_GPR we cannot run before they existed on all engines. */
4320     if (GRAPHICS_VER(gt->i915) < 9)
4321         return 0;
4322
4323     for (class = 0; class <= MAX_ENGINE_CLASS; class++) {
4324         int nsibling, err;
4325
4326         nsibling = select_siblings(gt, class, siblings);
4327         if (nsibling < 2)
4328             continue;
4329
4330         err = preserved_virtual_engine(gt, siblings, nsibling);
4331         if (err)
4332             return err;
4333     }
4334
4335     return 0;
4336 }
4337
4338 static int reset_virtual_engine(struct intel_gt *gt,
4339                 struct intel_engine_cs **siblings,
4340                 unsigned int nsibling)
4341 {
4342     struct intel_engine_cs *engine;
4343     struct intel_context *ve;
4344     struct igt_spinner spin;
4345     struct i915_request *rq;
4346     unsigned int n;
4347     int err = 0;
4348
4349     /*
4350      * In order to support offline error capture for fast preempt reset,
4351      * we need to decouple the guilty request and ensure that it and its
4352      * descendents are not executed while the capture is in progress.
4353      */
4354
4355     if (igt_spinner_init(&spin, gt))
4356         return -ENOMEM;
4357
4358     ve = intel_engine_create_virtual(siblings, nsibling, 0);
4359     if (IS_ERR(ve)) {
4360         err = PTR_ERR(ve);
4361         goto out_spin;
4362     }
4363
4364     for (n = 0; n < nsibling; n++)
4365         st_engine_heartbeat_disable(siblings[n]);
4366
4367     rq = igt_spinner_create_request(&spin, ve, MI_ARB_CHECK);
4368     if (IS_ERR(rq)) {
4369         err = PTR_ERR(rq);
4370         goto out_heartbeat;
4371     }
4372     i915_request_add(rq);
4373
4374     if (!igt_wait_for_spinner(&spin, rq)) {
4375         intel_gt_set_wedged(gt);
4376         err = -ETIME;
4377         goto out_heartbeat;
4378     }
4379
4380     engine = rq->engine;
4381     GEM_BUG_ON(engine == ve->engine);
4382
4383     /* Take ownership of the reset and tasklet */
4384     err = engine_lock_reset_tasklet(engine);
4385     if (err)
4386         goto out_heartbeat;
4387
4388     engine->sched_engine->tasklet.callback(&engine->sched_engine->tasklet);
4389     GEM_BUG_ON(execlists_active(&engine->execlists) != rq);
4390
4391     /* Fake a preemption event; failed of course */
4392     spin_lock_irq(&engine->sched_engine->lock);
4393     __unwind_incomplete_requests(engine);
4394     spin_unlock_irq(&engine->sched_engine->lock);
4395     GEM_BUG_ON(rq->engine != engine);
4396
4397     /* Reset the engine while keeping our active request on hold */
4398     execlists_hold(engine, rq);
4399     GEM_BUG_ON(!i915_request_on_hold(rq));
4400
4401     __intel_engine_reset_bh(engine, NULL);
4402     GEM_BUG_ON(rq->fence.error != -EIO);
4403
4404     /* Release our grasp on the engine, letting CS flow again */
4405     engine_unlock_reset_tasklet(engine);
4406
4407     /* Check that we do not resubmit the held request */
4408     i915_request_get(rq);
4409     if (!i915_request_wait(rq, 0, HZ / 5)) {
4410         pr_err("%s: on hold request completed!\n",
4411                engine->name);
4412         intel_gt_set_wedged(gt);
4413         err = -EIO;
4414         goto out_rq;
4415     }
4416     GEM_BUG_ON(!i915_request_on_hold(rq));
4417
4418     /* But is resubmitted on release */
4419     execlists_unhold(engine, rq);
4420     if (i915_request_wait(rq, 0, HZ / 5) < 0) {
4421         pr_err("%s: held request did not complete!\n",
4422                engine->name);
4423         intel_gt_set_wedged(gt);
4424         err = -ETIME;
4425     }
4426
4427 out_rq:
4428     i915_request_put(rq);
4429 out_heartbeat:
4430     for (n = 0; n < nsibling; n++)
4431         st_engine_heartbeat_enable(siblings[n]);
4432
4433     intel_context_put(ve);
4434 out_spin:
4435     igt_spinner_fini(&spin);
4436     return err;
4437 }
4438
4439 static int live_virtual_reset(void *arg)
4440 {
4441     struct intel_gt *gt = arg;
4442     struct intel_engine_cs *siblings[MAX_ENGINE_INSTANCE + 1];
4443     unsigned int class;
4444
4445     /*
4446      * Check that we handle a reset event within a virtual engine.
4447      * Only the physical engine is reset, but we have to check the flow
4448      * of the virtual requests around the reset, and make sure it is not
4449      * forgotten.
4450      */
4451
4452     if (intel_uc_uses_guc_submission(&gt->uc))
4453         return 0;
4454
4455     if (!intel_has_reset_engine(gt))
4456         return 0;
4457
4458     for (class = 0; class <= MAX_ENGINE_CLASS; class++) {
4459         int nsibling, err;
4460
4461         nsibling = select_siblings(gt, class, siblings);
4462         if (nsibling < 2)
4463             continue;
4464
4465         err = reset_virtual_engine(gt, siblings, nsibling);
4466         if (err)
4467             return err;
4468     }
4469
4470     return 0;
4471 }
4472
4473 int intel_execlists_live_selftests(struct drm_i915_private *i915)
4474 {
4475     static const struct i915_subtest tests[] = {
4476         SUBTEST(live_sanitycheck),
4477         SUBTEST(live_unlite_switch),
4478         SUBTEST(live_unlite_preempt),
4479         SUBTEST(live_unlite_ring),
4480         SUBTEST(live_pin_rewind),
4481         SUBTEST(live_hold_reset),
4482         SUBTEST(live_error_interrupt),
4483         SUBTEST(live_timeslice_preempt),
4484         SUBTEST(live_timeslice_rewind),
4485         SUBTEST(live_timeslice_queue),
4486         SUBTEST(live_timeslice_nopreempt),
4487         SUBTEST(live_busywait_preempt),
4488         SUBTEST(live_preempt),
4489         SUBTEST(live_late_preempt),
4490         SUBTEST(live_nopreempt),
4491         SUBTEST(live_preempt_cancel),
4492         SUBTEST(live_suppress_self_preempt),
4493         SUBTEST(live_chain_preempt),
4494         SUBTEST(live_preempt_ring),
4495         SUBTEST(live_preempt_gang),
4496         SUBTEST(live_preempt_timeout),
4497         SUBTEST(live_preempt_user),
4498         SUBTEST(live_preempt_smoke),
4499         SUBTEST(live_virtual_engine),
4500         SUBTEST(live_virtual_mask),
4501         SUBTEST(live_virtual_preserved),
4502         SUBTEST(live_virtual_slice),
4503         SUBTEST(live_virtual_reset),
4504     };
4505
4506     if (to_gt(i915)->submission_method != INTEL_SUBMISSION_ELSP)
4507         return 0;
4508
4509     if (intel_gt_is_wedged(to_gt(i915)))
4510         return 0;
4511
4512     return intel_gt_live_subtests(tests, to_gt(i915));
4513 }